• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Исследование методик распознования именнованных сущностей

ФИО студента: Мачнев Алексей Евгеньевич

Руководитель: Макаров Сергей Львович

Кампус/факультет: Факультет компьютерных наук

Программа: Программная инженерия (Бакалавриат)

Год защиты: 2019

В настоящее время задача выделения характеристик из названий товаров является актуальной для многих предприятий. Универсального автоматического решения данной задачи пока не найдено. Данная задача похожа на задачи распознавания именованных сущностей в тексте, выделения объектов из текста, информационного поиска, а также связана с задачами векторизации и классификации текстов и его частей. На эти темы имеется множество научных работ. Однако, во всех этих работах уделяется внимание именно текстам на естественных языках. Эти тексты, как правило, состоят из фиксированного набора слов, а их размеры значительно превышают размеры названий товаров. Это делает невозможным применить результаты этих работ напрямую для данной задачи. Однако, названия товаров также состоят из символов, и в целом имеют похожую структуру; в названиях товаров, как и в текстах, имеются скрытые взаимосвязи между символами. Таким образом, методики и принципы, описанные в этих работах, возможно адаптировать и применить к задаче выделения характеристик из названий товаров. В данной работе исследуется эта возможность. Данный отчет состоит из 41 страниц, 3 формул, 17 рисунков, одной таблицы и двух приложений. Приведены ссылки на 41 источник. Ключевые слова: выделение характеристик; методы машинного обучения; анализ текстов; классификация; информационный поиск.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ