• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Машинное обучение в задачах поиска синонимов в тексте естественного языка

ФИО студента: Закоян Роберт Тигранович

Руководитель: Пари Кентан Поль Бернар

Кампус/факультет: Факультет экономических наук

Программа: Экономика и статистика (Бакалавриат)

Год защиты: 2015

Проблема автоматического распознавания синонимии в текстах естественного языка наблюдается в подавляющем большинстве задач, предполагающих обработку такого текста. К сожалению, присущее людям понятие синонимии прямым образом никак не наследуется текстами, которые мы пишем, и, более того, оно не может быть математически строго формализовано. Из-за этих ограничений, при автоматическом (не ручном) анализе текста, если не возможно полагаться на сторонние "человеческие" оценки, применимы только косвенные методы. Один из широко используемых методов оценки семантической близости двух слов, фраз или каких-то других элементов текста основан на оценке семантического расстояние между ними. Цель этой работы - изучить этот метод, называющийся "Co-occurrence Retrieval Models", дать тщательный обзор его структуры, эффективности и условий эффективности его работы, сравнить с другими известными методами и предложить пути возможного улучшения метода или области исследования в целом. Будет проведено небольшое исследование на публично доступных текстовых данных. Также, будут обсуждены общие вопросы, касающиеся области исследования, вопросы ее значимости и актуальности.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ