• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Чувствительность языковых моделей на основе трансформеров к дискурсивным структурам

ФИО студента: Фомин Вадим Вячеславович

Руководитель: Артемова Екатерина Леонидовна

Кампус/факультет: Факультет гуманитарных наук

Программа: Компьютерная лингвистика (Магистратура)

Год защиты: 2020

Языковые модели на основе трансформеров (такие, как BERT, GPT-2, RuBERT) являются самой распространённой архитектурой языковых моделей. На основе таких моделей удаётся создавать эффективные решения для широкого класса задач компьютерной лингвистики, благодаря чему использование их для обработки естественного языка широко распространено. Несмотря на это, причины подобной эффективности не до конца ясны. Поэтому одним из важныъ направлений автоматической обработки текстов являются исследования внутренних механизмов нейронных языковых моделей. В частности, в рамках подобных исследований проводятся эксперименты, призванные доказать или опровергнуть наличие у языковых моделей определённых лингвистических знаний и связать эти знания с определёнными элементами архитектуры модели. В настоящей работе мы исследуем знания языковых моделей, связанные с дискурсивным уровнем языка. Для этого мы предлагаем ряд экспериментов на текстах на русском и английском языке, извлечённых из корпусов корпусов с дискурсивной разметкой (RST Discourse Treebank для английского и RuRS Treebank для русского). С помощью этих экспериментов мы показываем, что у языковых моделей BERT, GPT-2 и RuBERT есть знание дискурсивных структур. Кроме того, мы демонстрируем, как это знание распределено по слоям нейронных сетей, и анализируем особенности дискурсивных знаний трёх моделей.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ