• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ тональности сообщений в социальных сетях с использованием графических элементов

ФИО студента: Бабич Даниил -

Руководитель: Зеленков Юрий Александрович

Кампус/факультет: Высшая школа бизнеса

Программа: Бизнес-информатика (Бакалавриат)

Год защиты: 2021

В связи активным развитием социальных сетей и растущего потока неструктурированной информации особо актуальной становится задача анализа текстовых сообщений. При этом пользователи всё больше выражают своё отношение к сервисам и продуктам в публичном пространстве социальных сетей. Бизнес очень заинтересован в своевременном распознавании этого отношения и эмоциальной окраски таких сообщений. Подобную потребность призвана решить задача Анализа Тональности (Sentiment Analysis). Уже сейчас анализ тональности плотно интегрирован в бизнес-контекст и используется многими компаниями. Впрочем, задача анализа тональности имеет куда более широкий спектр применения в самых различных сферах и потому требует дальнейшего научного и практического развития. Однако человеческая речь, в особенности неформальная и письменная, очень пластична и динамична. Одним из разительных изменений можно назвать использование графических элементов в тексте – эмотиконов и эмодзи. Подобные символы по своей природе являются емким и узнаваемым источник эмоциональной окраски. В то же время ранее классические методы анализа тональности вовсе не включали их в рассмотрение. Однако корректное включение их в анализ тональности потенциально может улучшить и без того сложную задачу, которая включает в себя немалое количество тонкостей и нюансов. Целью данной работы является оценить, улучшит ли использование графических элементов в методах анализа тональности качество классификации. Для достижения главной цели работы последовательно были рассмотрены и решены задачи, связанные с теоретическим анализом всей задачи анализа тональности, её прикладными приложениями и нюансами, рассмотрением основных подходов к оценке, анализа и сбора релевантных источников реальных данных для экспериментальной проверки, анализом смежных работы, также направленных на рассмотрение графических элементов в контексте анализа текстов. На примере двух моделей: «state-of-art» глубокой нейросетевой языковой модели BERTweet архитектуры RoBERTa и модели векторных представлений слов Word2Vec рассмотрен простой, но показавший свою эффективность в распознавании полярных классов, метод и, предложены подходы к его улучшению. В связи с высокой практической значимостью и актуальностью задачи анализа тональности работа обосновывает необходимость в дальнейшем развитии идеи анализа графических элементов в сообщения в целом и рассмотренного подхода в частности.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ