• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Юмор в устной и письменной речи: автоматическое определение и основные признаки

ФИО студента: Пояганова Мария Сергеевна

Руководитель: Дурандин Олег Владимирович

Кампус/факультет: Факультет гуманитарных наук (Нижний Новгород)

Программа: Фундаментальная и прикладная лингвистика (Бакалавриат)

Год защиты: 2020

Данная работа посвящена автоматическому определению юмора в разговорной речи. Актуальность исследования обусловлена возрастающей популярностью голосовых помощников и чат-ботов в современной жизни, качественная работа которых зависит от их способности понимать и генерировать естественную речь. Юмор является неотъемлемым элементом речи, однако, в силу своей образности, трудно распознаваемым машиной. В данной работе используются методы машинного обучения для идентификации юмористических выражений по текстам реплик, а также по просодическим признакам высказываний. Материалом данного исследования являются исходные текстовые и звуковые данные корпуса MELD (S. Poria, 2018), размеченные нами в соответствии с поставленной задачей. Итоговый корпус составил 9899 реплик, из которых 325 являются юмористическими. Исследование показало, что нейронная сеть LSTM, а также модель распознавания именованных сущностей RoBERTA являются эффективными методами в данной задаче, позволяя достичь превышение случайного бейслайна на 0.04 на метрике F1. При этом успешность модели RoBERTA обуславливается ее способностью учитывать предшествующие реплики диалога. Кроме того, модель логистической регрессии в комбинации с техникой сэмплирования ADASYN, используя только просодические признаки речи, превышает случайный бейслайн на 0.2 с тональными параметрами речи как наиболее значимыми.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ