• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Сравнение моделей представления слов в задаче очистки текста от обсцененной лексики

ФИО студента: Котов Георгий Витальевич

Руководитель: Артемова Екатерина Леонидовна

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Оценка: 7

Год защиты: 2016

В данной работе проводится сравнение различных моделей представления текстов в задаче очистки текста от обесцененной лексики. Для тестирования этих моделей собрана и размечена коллекция текстов с сайта lurkmore. В качестве основных параметров сравнения рассматриваются точность и полнота, причем отмечается важность последнего критерия. Из рассмотренных моделей, лучшей оказывается модель аннотированного суффиксного дерева. Разработка методов очистки текста от обесцененной лексики имеет важное прикладное значение: они могут быть использованы, например, в системах родительского контроля и для упрощения труда редакторов онлайн-ресурсов.

Текст работы (работа добавлена 30 мая 2016 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ