Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ

Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя

Показаны работы: 1 - 2 из 2

Оценка вклада онтологической информации в распознавание кореферентных связей на материале русского языкаКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Азеркович Илья Леонидович

Руководитель:

Толдова Светлана Юрьевна

Дисс. совет:

Совет по филологии

Дата защиты:

9/17/2021

Диссертационная работа посвящена оценке того, какой вклад вносит информация, не включенная непосредственно в высказывание, в успешное распознавание кореферентных связей, на материале русского языка. Несмотря на то, что важность информации такого рода, как правило, подразумевается исследователями в своих работах, полноценной оценки роли семантической информации для процесса разрешения кореферентности для русского языка ранее не проводилось. В работе описана семантически мотивированная классификации кореферентных отношений и проведено корпусное исследование частоты их встречаемости, а также проанализирована встречаемость различных классов отношений в зависимости от жанра текста. Также в работе описано несколько этапов экспериментов, опирающихся на разработанную классификацию, с использованием различных способов представления информации и алгоритмов анализа. Результаты экспериментов позволяют сделать вывод о важности семантической информации для задач разрешения кореферентности. Полученные данные представляют как теоретический интерес, так и практическую ценность для разработки систем автоматического анализа.

Ключевые слова:

кореферентные связи, корпусный анализ, машинное обучение, нейронные сети, разрешение кореферентности, семантическая информация

Диссертация [*.pdf, 1.64 Мб] (дата размещения 7/16/2021)

Резюме [*.pdf, 311.50 Кб] (дата размещения 7/16/2021)

Summary [*.pdf, 143.03 Кб] (дата размещения 7/16/2021)

Методы автоматического выделения тезаурусных отношений на основе словарных толкованийКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Алексеевский Даниил Андреевич

Руководитель:

Толдова Светлана Юрьевна

Дисс. совет:

Совет по филологии

Дата защиты:

11/20/2018

С некоторыми задачами обработки текстов человек справляется лучше, чем компьютер. Например, в отличие от компьютера человек может легко найти в коротком отрывке все упоминания жидкостей и сосудов. Чтобы компьютер смог отвечать на такого рода вопросы, ему нужны базовые представления о мире, например, что чашка -- это сосуд, а чай -- это жидкость. Такие знания называются тезаурусными отношениями. В читаемом для людей виде они содержатся в толковых словарях: "Чашка 1. Небольшой, обычно округлой формы, с ручкой, сосуд для питья". Понятным компьютеру способом представления таких знаний являются семантические сети: тезаурусы и онтологии. Защищаемая работа посвящена автоматизации построения тезауруса на основе толкового словаря. В работе предложен новый подход к извлечению отношений, состоящий из трёх этапов. Для того, чтобы извлекать отношения из толкований, нужно обозреть всё их разнообразие. В помощь исследователю предлагается автоматически группировать похожие по синтаксической структуре толкования так, чтобы легко было убедиться, что все типы толкований охвачены. Это и есть первый этап. На втором этапе исследователь описывает интересные ему свойства каждой группы толкований, а компьютер по описаниям извлекает из толкований тезаурусные отношения. В результате получается набор пар слов, связанных отношениями. Чтобы собрать из них тезаурус, необходимо объединить их в одну сеть: из набора пар чашка-сосуд, чашка-миска, сосуд-вместилище, сосуд-орган нужно понять, в каких случаях мы говорим об одном понятии. Наша цель получить в этом случае цепочку чашка-сосуд-вместилище. Решение такой задачи называется дизамбигуацией и является заключительным этапом работы. Для каждого этапа исследованы и описаны существующие подходы, проведены эксперименты для сравнения различных подходов, предложено наилучшее решение среди исследованных.

Ключевые слова:

автоматическая обработка текстов, векторные семантические модели, ворднет, дизамбигуация, извлечение отношений, обучение с частичным привлечением учителя, тезаурус

Диссертация [*.pdf, 1.14 Мб] (дата размещения 9/20/2018)

Резюме [*.pdf, 169.73 Кб] (дата размещения 9/20/2018)

Summary [*.pdf, 222.18 Кб] (дата размещения 9/20/2018)

Название:
Автор:
Научный руководитель:
Ключевые слова:
Год защиты:
Тип диссертации:
Тип ученой степени:
Диссертационный совет:
Специальность:
Показать работы только с полным текстом диссертации