• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Неавторегрессивный вариационный автокодировщик для текстовых данных

ФИО студента: Милоградский Александр Николаевич

Руководитель: Рябинин Максим Константинович

Кампус/факультет: Высшая школа бизнеса

Программа: Бизнес-информатика (Бакалавриат)

Оценка: 8

Год защиты: 2021

Обычные языковые модели на рекуррентных нейронных сетях генерируют текст слово за словом и никак не берут в расчёт глобальное представление всего предложения. В то же время генеративные модели на основе вариационного автокодировщика (Variational Autoencoder или VAE) работают с латентным представлением всего предложения и как обычные языковые модели на нейронных сетях авторегрессивно строят текст. Это позволяет VAE явно моделировать такие особенности текста, как стиль, синтаксис. Неавторегрессивные модели, в свою очередь, генерируют все токены за раз, что повышает эффективность параллельной обработки предложений и скорость генерации. Однако, моделирование такого сложного совместного распределения на все слова одновременно - трудная задача даже для глубоких нейронных сетей с гибкой и сложной структурой. В данной работе были рассмотрены генеративные модели, основанные на вариационном автокодировщике для текста, как с авторегрессивными подходами, так и с неавторегрессивными подходами, которые не строят предложения слово за слово, а порождают их за одно действие. Было показано как структурно отличаются неавторегрессивные модели от авторегрессивных, предложены возможные архитектуры и произведено сравнение их качества работы на различных текстовых данных. Также были выяснены проблемы текущих генеративных моделей, основанных на вариационном автокодировщике для текста.

Текст работы (работа добавлена 17 мая 2021 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ