• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Визуализация результатов поиска по корпусу в виде дерева

ФИО студента: Чащина Александра Игоревна

Руководитель: Ляшевская Ольга Николаевна

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Год защиты: 2017

Электронные корпуса широко используются в исследованиях. Функции полнотекстового поиска по корпусу позволяют быстро получить необходимый лингвистический материал. Пользователям может быть необходимо представить этот материал в виде иллюстративной визуализации. В то время как такие инструменты визуализации доступны для других языков, в настоящее время не существует программы, широко использующейся для визуализации результатов поиска по Национальному корпусу русского языка. Целью настоящей работы является создание такого инструмента. За основу взят подход, представленный в Gambette & Véronis 2010, который реализован в программе TreeCloud. TreeCloud - это инструмент визуализации текстовых данных в виде дерева, где слова представлены листьями, а ветки отражают семантическую близость между ними. Оригинальная версия Treecloud имеет несколько недоработок, в том числе высокая зависимость от внешних программ, отсутствие кросс-платформенности, поддержка только нескольких языков. В настоящей работе представлен новая версия TreeCloud, адаптированная для использования на русскоязычных данных. Новая версия доступна в форме web-приложения (http://1-dot-treecloud-web.appspot.com), а также java desktop-приложения (https://github.com/aleksandrachasch/treecloud), имеющего минимальное количество зависимостей.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ