• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ

Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя

Показаны работы: 1 - 2 из 2

Оценка вклада онтологической информации в распознавание кореферентных связей на материале русского языкаКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Азеркович Илья Леонидович
Дисс. совет:
Совет по филологии
Дата защиты:
9/17/2021
Диссертационная работа посвящена оценке того, какой вклад вносит информация, не включенная непосредственно в высказывание, в успешное распознавание кореферентных связей, на материале русского языка. Несмотря на то, что важность информации такого рода, как правило, подразумевается исследователями в своих работах, полноценной оценки роли семантической информации для процесса разрешения кореферентности для русского языка ранее не проводилось. В работе описана семантически мотивированная классификации кореферентных отношений и проведено корпусное исследование частоты их встречаемости, а также проанализирована встречаемость различных классов отношений в зависимости от жанра текста. Также в работе описано несколько этапов экспериментов, опирающихся на разработанную классификацию, с использованием различных способов представления информации и алгоритмов анализа. Результаты экспериментов позволяют сделать вывод о важности семантической информации для задач разрешения кореферентности. Полученные данные представляют как теоретический интерес, так и практическую ценность для разработки систем автоматического анализа.
Диссертация [*.pdf, 1.64 Мб] (дата размещения 7/16/2021)
Резюме [*.pdf, 311.50 Кб] (дата размещения 7/16/2021)
Summary [*.pdf, 143.03 Кб] (дата размещения 7/16/2021)

Методы автоматического выделения тезаурусных отношений на основе словарных толкованийКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:
Алексеевский Даниил Андреевич
Дисс. совет:
Совет по филологии
Дата защиты:
11/20/2018
С некоторыми задачами обработки текстов человек справляется лучше, чем компьютер. Например, в отличие от компьютера человек может легко найти в коротком отрывке все упоминания жидкостей и сосудов. Чтобы компьютер смог отвечать на такого рода вопросы, ему нужны базовые представления о мире, например, что чашка -- это сосуд, а чай -- это жидкость. Такие знания называются тезаурусными отношениями. В читаемом для людей виде они содержатся в толковых словарях: "Чашка 1. Небольшой, обычно округлой формы, с ручкой, сосуд для питья". Понятным компьютеру способом представления таких знаний являются семантические сети: тезаурусы и онтологии. Защищаемая работа посвящена автоматизации построения тезауруса на основе толкового словаря. В работе предложен новый подход к извлечению отношений, состоящий из трёх этапов. Для того, чтобы извлекать отношения из толкований, нужно обозреть всё их разнообразие. В помощь исследователю предлагается автоматически группировать похожие по синтаксической структуре толкования так, чтобы легко было убедиться, что все типы толкований охвачены. Это и есть первый этап. На втором этапе исследователь описывает интересные ему свойства каждой группы толкований, а компьютер по описаниям извлекает из толкований тезаурусные отношения. В результате получается набор пар слов, связанных отношениями. Чтобы собрать из них тезаурус, необходимо объединить их в одну сеть: из набора пар чашка-сосуд, чашка-миска, сосуд-вместилище, сосуд-орган нужно понять, в каких случаях мы говорим об одном понятии. Наша цель получить в этом случае цепочку чашка-сосуд-вместилище. Решение такой задачи называется дизамбигуацией и является заключительным этапом работы. Для каждого этапа исследованы и описаны существующие подходы, проведены эксперименты для сравнения различных подходов, предложено наилучшее решение среди исследованных.
Диссертация [*.pdf, 1.14 Мб] (дата размещения 9/20/2018)
Резюме [*.pdf, 169.73 Кб] (дата размещения 9/20/2018)
Summary [*.pdf, 222.18 Кб] (дата размещения 9/20/2018)