• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Детектор фейковых новостей как новый критерий оценки текстовых GANs (генеративно-состязательных сетей)

ФИО студента: Быстрова Ольга Владимировна

Руководитель: Орехов Борис Валерьевич

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Год защиты: 2020

В данной работе рассматривается проблема генерации и детектирования сгенерированного текста на примере новостных текстов. Для задачи классификации фейковых новостей, написанных с применением нейронных сетей, был создан датасет, состоящий из реальных новостных текстов и сгенерированных GPT-2 моделью текстов с разными типами сэмплирования. Всего датасет содержит 1,2 млн текстов. В качестве классификаторов были рассмотрены различные модели, наилучшие результаты показали LSTM модель и одна из моделей BERT’a. Обе модели были также рассмотрены с точки зрения интерпретации их работы. Также были рассмотрены основные типы сэмплирования и их влияние на работу классификаторов фейковых новостей. Для работы над второй проблемой, связанной с генерацией текста, в рамках исследования были использованы алгоритмы обучения генеративно-состязательных сетей с различными дискриминаторами для дообучения языковой модели.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ