• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ


Введите первые несколько букв фамилии

Введите первые несколько букв фамилии

Показаны работы: 1

Сортировка:   по дате защиты   по имени соискателя   по имени научного руководителя   

Методы автоматического выделения тезаурусных отношений на основе словарных толкований Кандидатская диссертация Ученая степень НИУ ВШЭ

Соискатель:Алексеевский Даниил Андреевич
Руководитель:Толдова Светлана Юрьевна
Дата защиты:20.11.2018

С некоторыми задачами обработки текстов человек справляется лучше, чем компьютер. Например, в отличие от компьютера человек может легко найти в коротком отрывке все упоминания жидкостей и сосудов. Чтобы компьютер смог отвечать на такого рода вопросы, ему нужны базовые представления о мире, например, что чашка -- это сосуд, а чай -- это жидкость. Такие знания называются тезаурусными отношениями. В читаемом для людей виде они содержатся в толковых словарях: "Чашка 1. Небольшой, обычно округлой формы, с ручкой, сосуд для питья". Понятным компьютеру способом представления таких знаний являются семантические сети: тезаурусы и онтологии. Защищаемая работа посвящена автоматизации построения тезауруса на основе толкового словаря. В работе предложен новый подход к извлечению отношений, состоящий из трёх этапов. Для того, чтобы извлекать отношения из толкований, нужно обозреть всё их разнообразие. В помощь исследователю предлагается автоматически группировать похожие по синтаксической структуре толкования так, чтобы легко было убедиться, что все типы толкований охвачены. Это и есть первый этап. На втором этапе исследователь описывает интересные ему свойства каждой группы толкований, а компьютер по описаниям извлекает из толкований тезаурусные отношения. В результате получается набор пар слов, связанных отношениями. Чтобы собрать из них тезаурус, необходимо объединить их в одну сеть: из набора пар чашка-сосуд, чашка-миска, сосуд-вместилище, сосуд-орган нужно понять, в каких случаях мы говорим об одном понятии. Наша цель получить в этом случае цепочку чашка-сосуд-вместилище. Решение такой задачи называется дизамбигуацией и является заключительным этапом работы. Для каждого этапа исследованы и описаны существующие подходы, проведены эксперименты для сравнения различных подходов, предложено наилучшее решение среди исследованных.

Дисс. совет:Совет по филологии
Ключевые слова:автоматическая обработка текстов, векторные семантические модели, ворднет, дизамбигуация, извлечение отношений, обучение с частичным привлечением учителя, тезаурус
Диссертация [*.pdf, 1.14 Mb] (дата размещения 20.09.2018)
Резюме [*.pdf, 169.73 Kb] (дата размещения 20.09.2018)
Summary [*.pdf, 222.18 Kb] (дата размещения 20.09.2018)