• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Автоматическое извлечение информации о действующих лицах из новостных статей

ФИО студента: Никишина Ирина Александровна

Руководитель: Уткина Ирина Евгеньевна

Кампус/факультет: Факультет гуманитарных наук (Нижний Новгород)

Программа: Фундаментальная и прикладная лингвистика (Бакалавриат)

Оценка: 10

Год защиты: 2017

Данная работа посвящена автоматическому извлечению информации о действующих лицах из новостных ресурсов. В настоящее время автоматическая обработка естественного языка (Natural Language Processing) используется во всех сферах жизни общества. Автоматизация анализа больших объемов данных не только позволяет ускорить процесс, но и предоставляет средства, необходимые для хранения и визуализации информации. Именно поэтому данная работа ориентирована на создание автоматических средств анализа текстовых данных. Результатом работы является программный продукт (приложение), позволяющий автоматически извлекать информацию о действующих лицах из новостных статей. Программа автоматически определяет имена действующих лиц из текста, распределяя их в кластеры. После загрузки статьи пользователь может получить интересующую его информацию о статьях, действующих лицах и взаимоотношениях между ними при помощи специального языка запросов, максимально приближенного к английскому языку. На основании полученных данных можно выполнить построение графа взаимоотношений между героями и определить его основные характеристики. Более того, пользователь может получить информацию о контекстах, в которых употребляются указанные действующие лица. Приложение также упрощает и ускоряет контент-анализ данных, так как предоставляет пользователю разметку предложений, в которых упоминается данное действующее лицо, а также ключевую информацию, используя морфологические критерии. Важно отметить, что данный продукт может быть использован в любых областях, связанных с анализом текста и определением личных имен.

Текст работы (работа добавлена 22 мая 2017 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ