• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Автоматическое извлечение риторических отношений на уровне предложения в русском языке

ФИО студента: Захарова Елена Сергеевна

Руководитель: Толдова Светлана Юрьевна

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Год защиты: 2018

Информация о структуре дискурса текста может быть полезна для многих задач обработки естественного языка и генерации текста на естественном языке, поэтому проблема автоматического анализа структуры дискурса является одной из перспективных областей исследований в области компьютерной лингвистики. Теория Риторических Структур - это фреймворк, созданный для анализа структуры дискурса, который позволяет описать взаимосвязь между единицами текста на всех уровнях и представить его в виде иерархической древовидной структуры. Реализация алгоритма автоматического анализа дискурса включает в себя две подзадачи: сегментацию дискурса на Элементарные Дискурсивные Единицы (ЭДЕ) и собственно анализ дискурсивной структуры. Существует несколько автоматических парсеров дискурса для английского языка, и если первая подзадача решается на уровне state-of-art, то вторая еще не решена на таком уровне качества. Для русского же языка, пока не существует открытого и доступного парсера дискурса. В настоящей работе я не буду рассматривать задачу сегментации и вместо этого сосредоточусь на анализе структуры дискурса русских письменных текстов на уровне предложения. Таким образом, целью этой работы является создание алгоритма автоматического анализа дискурса для предложений на русском языке, заранее разделенных на ЭДЕ, с использованием алгоритмов машинного обучения с учителем и размеченного корпуса русских текстов.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ