• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ тональности текстов с использованием семантических признаков на основе методов машинного обучения

ФИО студента: Сметанин Сергей Игоревич

Руководитель: Комаров Михаил Михайлович

Кампус/факультет: Высшая школа бизнеса

Программа: Электронный бизнес (Магистратура)

Год защиты: 2018

В настоящее время отзывы пользователей на товары в интернет-магазинах являются ценным источником информации с точки зрения оценки их уровня лояльности, предпочтений и потребностей. Данная работа посвящена разработке трехклассового классификатора для анализа тональности русскоязычных отзывов на товары из интернет-магазинов с учетом семантических признаков. Набор данных для обучения был сформирован из отзывов с сайтов Pandao и Aliexpress, где метками классов являлся рейтинг отзывов, проставленный пользователями. В данной работе предложены архитектуры однослойной сверточной нейронной сети и рекуррентной нейронной сети с долгой краткосрочной памятью (построены с помощью Keras и Theano) для анализа тональности, рассмотрен процесс обучения, валидации и тестирования моделей. Модель Word2Vec, обученная на сформированном корпусе данных, была использована для инициализации весов первых слоев нейронных сетей. Также в работе были использованы два эталонных решения: мультиномиальный байесовский классификатор и классификация с помощью асессоров сервиса Яндекс.Толока. Наивысшая оценка качества обученных моделей в критериях F-меры составила 71.27% для ансамбля сверточной нейронной сети и рекуррентной нейронной сети с долгой краткосрочной памятью, таким образом превысив показатели всех эталонных моделей.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ