• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Модели и методы автоматического обнаружения, верификации и анализа недостоверной, искаженной и манипулятивной информации в текстовых данныхModels and methods of automatic detection, verification and analysis of fake, distorted and manipulative information in text data

Члены комитета:
Деркач Денис Александрович (НИУ ВШЭ, PhD, председатель комитета), Евсеев Дмитрий Андреевич (ООО «Пайн Форест», к.т.н., член комитета), Панченко Александр Иванович (Сколковский институт науки и технологий, д.комп.н., член комитета), Рахуба Максим Владимирович (НИУ ВШЭ, к.ф.-м.н, член комитета), Шелманов Артем Олегович (Университет искусственного интеллекта имени Мохамеда бен Заида (Объединенные Арабские Эмираты), к.т.н., член комитета)
Диссертация принята к предварительному рассмотрению:
5/29/2025
Диссертация принята к защите:
6/26/2025
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
9/5/2025
Диссертационное исследование посвящено разработке комплексного подхода к автоматическому анализу текстовых данных для выявления и противодействия распространению недостоверной информации. В работе исследованы три взаимосвязанных направления: автоматическая верификация фактов на основе авторитетных источников, поиск ранее проверенных утверждений и стилистический анализ манипулятивных техник в текстах. В рамках первого направления создан эффективный пайплайн для проверки фактов, включающий компоненты поиска информации и логического вывода. Разработана диагностическая таксономия для анализа моделей и предложен генеративный фреймворк, повышающий качество модели верификации. На основе метода реализована демонстрационная система. Для поиска ранее проверенных утверждений предложен комбинированный подход, объединяющий лексическую и семантическую схожесть текстов, для обучения которого разработана функция потерь BSC, превосходящая существующие методы. Кроме того, создан новый набор данных с применением техник distant supervision для обучения моделей. В области анализа манипулятивных техник представлен подход, включающий сегментацию и классификацию. В процессе выявлены и частично устранены общие недостатки Transformer-based моделей. Разработана классификационная схема для русскоязычных манипулятивных приемов и создан соответствующий набор данных. Результаты исследования формируют основу для создания автоматических систем противодействия дезинформации, что особенно актуально в современных условиях информационного общества.
Диссертация [*.pdf, 4.72 Мб] (дата размещения 7/5/2025)
Резюме [*.pdf, 998.82 Кб] (дата размещения 7/5/2025)
Summary [*.pdf, 960.82 Кб] (дата размещения 7/5/2025)

Публикации, в которых излагаются основные результаты диссертации

Chernyavskiy A., Ilvovsky D., Nakov P. WhatTheWikiFact: Fact-Checking Claims Against Wikipedia (смотреть на сайте журнала)
Chernyavskiy A., Ilvovsky D., Nakov P. Transformers: “The End of History” for Natural Language Processing? (смотреть на сайте журнала)
Galitsky B., Chernyavskiy A., Ilvovsky D. Truth-O-Meter: Handling Multiple Inconsistent Sources Repairing LLM Hallucinations (смотреть на сайте журнала)
Chernyavskiy A., Ilvovsky D., Nakov P. Enhancing FEVER-Style Claim Fact-Checking Against Wikipedia: A Diagnostic Taxonomy and a Generative Framework (смотреть на сайте журнала)


Отзывы
Отзыв научного руководителя
Отзыв члена Комитета
Отзыв ведущей организации
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 05.09.2025). Решением диссертационного совета (протокол № 8 от 18.09.2025) присуждена ученая степень кандидата компьютерных наук.