Выявление релевантных дискурсивных признаков для решения задач анализа текстовых данныхInformative discourse feature selection for analysis of textual data

Соискатель:

Гончарова Елизавета Федоровна

Руководитель:

Кузнецов Сергей Олегович (др. работы под рук-вом)

Члены комитета:

Бурцев Михаил Сергеевич (АНО «Институт искусственного интеллекта», кандидат физико-математических наук, председатель комитета), Митков Руслан (Вулверхэмптонский университет, PhD, член комитета), Сидоров Григорий Олегович (Национальный политехнический институт (Мехико), кандидат филологических наук, член комитета), Тутубалина Елена Викторовна (Sber AI (Институт искусственного интеллекта), кандидат физико-математических наук, член комитета), Шелманов Артем Олегович (Автономная некоммерческая организация «Институт искусственного интеллекта», кандидат технических наук, член комитета)

Диссертация принята к предварительному рассмотрению:

7/8/2022

Диссертация принята к защите:

9/2/2022 (Протокол №15)

Дисс. совет:

Совет по компьютерным наукам

Дата защиты:

9/26/2022

В настоящее время область обработки естественного языка напрямую связана с большими предобученными языковыми моделями, работающими на базе архитектуры Трансформер, которые превзошли все существующие до этого методы решения задач обработки естественного языка. Однако, подобные результаты связаны, в первую очередь, с хорошей обобщающей способностью этих моделей, обученных на больших корпусах текстов на естественном языке, а не с их пониманием лингвистической информации. Исследования показывают, что обеспечение моделей дополнительными знаниями о языке, которыми обладают лингвисты, может улучшить качество решения ряда сложных задач обработки естественного языка, например, позволит более точно находить ответы на вопросы в тексте, генерировать более разнообразный и логически-связанный текст. В данной работе исследуется возможность добавления информации о дискурсивной структуре текста в предобученную языковую модель BERT за счет обучения модели на новой модифицированной задаче маскированного языкового моделирования, а также за счет добавления в модель дискурсивно-обусловленного механизма внимания. Также в диссертации предлагается новый подход для интерпретации результатов работы языковых моделей посредством анализа дискурсивной структуры текста. Проведенные экспериментальные исследования показали, что дискурсивно-обогащенные модели превосходят стандартные модели при решении задач оценки аргументированности текстов, понимания прочитанного текста, а также извлечения текстовых обоснований для объяснения результатов работы моделей.

Диссертация [*.pdf, 3.21 Мб] (дата размещения 7/11/2022)

Резюме [*.pdf, 955.94 Кб] (дата размещения 7/11/2022)

Summary [*.pdf, 965.46 Кб] (дата размещения 7/11/2022)

Публикации, в которых излагаются основные результаты диссертации

Galitsky, B., Ilvovsky, D., Goncharova, E. Relying on Discourse Analysis to Answer Complex Questions by Neural Machine Reading Comprehension

Galitsky, B., Ilvovsky, D., Goncharova, E. Relying on Discourse Trees to Extract Medical Ontologies from Text

Goncharova, E., Ilvovsky, D., Galitsky, B. Concept-based chatbot for interactive query refinement in product search

Galitsky, B., Ilvovsky, D., Goncharova, E. On a chatbot conducting dialogue-in-dialogue

Galitsky, B., Ilvovsky, D., Goncharova, E. On a chatbot providing virtual dialogues

Goncharova, E.F., Kuznetsov, S.O. Increasing the efficiency of packet classifiers with closed descriptions

Отзывы

Отзыв научного руководителя

Отзыв научного руководителя (дата размещения 7/8/2022)

Отзыв члена Комитета

Отзыв председателя Комитета (дата размещения 9/21/2022)
Отзыв члена Комитета (дата размещения 9/21/2022)
Отзыв члена Комитета (дата размещения 9/21/2022)
Отзыв члена Комитета (дата размещения 9/21/2022)
Отзыв члена Комитета (дата размещения 9/21/2022)

Сведения о результатах защиты:

Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 26.09.2022). Решением диссертационного совета (протокол № 18 от 12.10.2022) присуждена ученая степень кандидата компьютерных наук.

Ключевые слова:

анализ текстовых данных, архитектура Трансформер, дискурсивный признак, естественный язык

См. на ту же тему

Модели и методы автоматического обнаружения, верификации и анализа недостоверной, искаженной и манипулятивной информации в текстовых данныхКандидатская диссертация

Соискатель: Чернявский Антон Сергеевич
Руководитель: Ильвовский Дмитрий Алексеевич
Дата защиты: 9/5/2025

Применение глубоких нейросетевых моделей, учитывающих структурную лингвистическую информацию, в прикладных задачах анализа текстовых данныхКандидатская диссертация

Соискатель: Чернявский Александр Сергеевич
Руководитель: Ильвовский Дмитрий Алексеевич
Дата защиты: 6/27/2025