• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Разработка поисковой системы для корпусной платформы

ФИО студента: Максимова Анастасия Олеговна

Руководитель: Архангельский Тимофей Александрович

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Оценка: 8

Год защиты: 2017

В дипломной работе "Разработка поисковой системы для корпусной платформы" описывается исследование, изучающее особенности поведения пользователей во время поисковой сессии и направленное на поиск методов улучшения лингвистического поиска. Основной целью работы является поиск дополнительных способов ускорения поискового процесса путём доработки способа хранения данных. Так, автор выдвигает две гипотезы, связанные с поведением пользователя в корпусной поисковой системе. Первая гипотеза связана с индексированием текстов и идеей хранения некоторых частей морфологических шаблонов отдельно. Предполагается, что если какие-то морфологические шаблоны достаточно частотны, их имеет смысл индексировать отдельно, и впоследствии вызывать выдачу по такому обособленному индексу. Вторая гипотеза касается непосредственно пользовательского поведения в рамках одной сессии. Автор утверждает, что, проводя исследование с помощью корпуса, пользователь повторяет некоторые из своих запросов более 1 раза, а потому дополнительное кэширование результатов на время этой поисковой сессии позволит ускорить поиск. Исследование проводится на материалах крупнейших русскоязычных корпусов, таких как НКРЯ, Leeds, ГИКРЯ и других. Все программы для обработки поисковых логов упомянутых корпусов были написаны автором работы на языке программирования Python.

Текст работы (работа добавлена 30 мая 2017 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ