• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Автоматический анализ литературных произведений с помощью моделей дистрибутивной семантики

ФИО студента: Жукова Алина Сергеевна

Руководитель: Ильвовский Дмитрий Алексеевич

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2019

Модели дистрибутивной семантики, такие как векторные представления слов, демонстрируют высокое качество и хорошую производительность в задачах естественной обработки языка. Ряд исследований показал, что эти модели, обученные на огромных текстовых корпусах, хорошо справляются с различными семантическими задачами. В данной работе рассматривается возможность применения векторных представлений слов к конкретной задаче литературного анализа – извлечение социальных сетей из художественной литературы, которая обладает ограниченным объёмом входных данных. В нашем исследовании модели сначала обучаются на текстах популярных книжных серий фэнтезийных романов, «Песнь Льда и Пламени» и «Гарри Поттер», а затем оценивается их качество на основе выделенных связей. Извлекаемые социальные сети сравниваются с «золотым стандартом», полученным с помощью краудсорсинга. Данное исследование фокусируется на предварительной обработке текста, с помощью которой увеличивается число контекстов, в которых появляются персонажи, используя различные алгоритмы разрешения кореференции, а также благодаря заменам разных форм имени одного и того же героя на некоторый стандартный вид.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ