• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Автоматическое построение графов для анализа художественных произведений

ФИО студента: Цыганкова Виктория Сергеевна

Руководитель: Алескеров Фуад Таги оглы

Кампус/факультет: Факультет гуманитарных наук

Программа: Компьютерная лингвистика (Магистратура)

Год защиты: 2016

Целью работы является построение графов взаимодействий персонажей в тексте произведения, а также анализ сбалансированости построенных графов. Для достижения поставленной цели нами поставлены следующие задачи: • проанализировать существующие модели автоматического построения графов взаимодействий между персонажами в произведении, • найти (или создать) инструменты для разметки текста, • выделить героев в тексте произведения, • выделить отношения между персонажами в произведении, • построить граф взаимодействий, • оценить качество построенных графов, • проанализировать сбалансированность текста. На основе анализа существующих систем построения графов, основанных на вычленении отношений между персонажами из текста, нами написана новая система &mdash;&mdash; NovelGraphs &mdash;&mdash; для текстов на английском языке, в которой используется новый метод выявления персонажей и выделения отношений между ними. В полученном ненаправленном графе вершинам соответствуют герои произведения, а ребра задают взаимодействия между ними в тексте произведения. Каждое ребро имеет свой вес, который соотносится со средней оценкой тональности контекста или частотой употребления в тексте пары героев. Если ребро не имеет веса, тогда оно не будет отражено в графе взаимодействий. По итогам сравнения построенных автоматически графов с <<золотым стандартом>> (т.е. графом, построенным экспертом) лучший результат показали экстракторы TokenDistance (выделяет персонажей, если расстояние между ними меньше, либо равно 15 токенам) и TokenDependencies (выделяет персонажей, если их разделяет глагол, с которым они связаны синтаксически). На данный момент, комбинации экстракторов с агрегаторами лучше справляются с задачей выявления персонажей из текста, нежели с выделением отношений между ними. В работе также было установлено, что анализ сбалансированности графов идентифицирует <<ключевые>> эпизоды произведения, которые соотносятся с минимумами и максимумами на графике сбалансированности.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ