• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Метод автоматического исправления опечаток в русскоязычных текстах пользователей социальных сетей

ФИО студента: Феногенова Алена Сергеевна

Руководитель: Алексеевский Даниил Андреевич

Кампус/факультет: Факультет гуманитарных наук

Программа: Теория языка и компьютерная лингвистика (Магистратура)

Оценка: 10

Год защиты: 2017

На сегодняшний день Интернет является основным источником информации и наиболее популярным средством общения людей всего мира. Как результат, в сети находится огромное количество текстов, которые необходимо обрабатывать – как нормативных: художественная литература и новости, так и более неформальных: блоги, комментарии, посты пользователей и т.д.. Такие тексты, в большей степени неформальные, содержат огромный пласт лексики (сленг, жаргоны, англицизмы, неологизмы), который прикладным комплексными системами, такими как морфологические, сентимент и синтаксический анализаторы сложно обрабатывать. В связи с этим возникает необходимость в создании подхода к лексической обработке, нормализации именно сетевых текстов. С теоретической точки зрения результаты работы также будут интересны, например, исследователям процессов языкового взаимодействия, лексикографам и др. Данная работа посвящена обработке текстов сети Интернет и в частности исправлению опечаток в сетевых текстах. В ходе работы создан подход на базе методов глубинного обучения, рассматривается, как он справляется с поставленной задачей. Кроме того создан модуль исправления опечаток на основе традиционных подходов. Оба эти метода сравнены друг с другом и со свободной системой исправления опечаток в открытом доступе Hunspell.

Текст работы (работа добавлена 29 мая 2017 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ