• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Моделирование выбора посессивного показателя в хантыйском языке с помощью алгоритмов машинного обучения

ФИО студента: Смирнова Алина Александровна

Руководитель: Толдова Светлана Юрьевна

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Год защиты: 2021

Посессивные конструкции в своём прямом значении используются для выражения отношений родства, части тела, принадлежности и др. Во многих языках существует более одной посессивной конструкции. В таких случаях возникает вопрос распределения контекстов между стратегиями маркирования. Нередки ситуации, когда даже для одного и того же контекста допустимо более одной конструкции. Выбор между стратегиями для каждого конкретного языка может зависеть от очень разных вещей: от синтаксических свойств и морфологических характеристик до семантики и дискурсивных причин. Часто факторы взаимодействуют между собой и бывает сложно определить, какой именно из них является в языке решающим. Так происходит в казымском диалекте хантыйского языка, где для выражения посессивных отношений может использоваться как конструкция с вершинным маркированием, так и простое соположение. Вопрос влияния различных факторов на выбор стратегии маркирования поднимался как для родственных диалектов, так и для казымского хантыйского. Среди параметров, определяющих наиболее вероятную конструкцию, называют морфологические характеристики посессора, семантическое отношение, референциальный статус, синтаксическую позицию и др. Тем не менее, ни один из факторов не получается назвать ключевым. Посессивный маркер в хантыйском языке, как и в родственных уральских, может употребляться дискурсивно, когда семантических предпосылок для использования посессивной конструкции нет. Что именно определяет, появится ли на именной группе дискурсивный маркер, выяснить пока не удалось. В нашем исследовании мы попробуем решить проблему определения ключевых факторов выбора стратегии посессивного маркирования с помощью алгоритмов машинного обучения. Подобный подход ранее успешно применялся для анализа посессивный конструкций в бесермянском удмуртском. В нашей работе более 2000 ИГ, взятых из корпуса текстов казымского хантыйского, размечены по широкому ряду параметров и проанализированы четырьмя алгоритмами машинного обучения с целью определить, какие из параметров сильнее всего влияют на появление посессивного маркера на именной группе в собственно посессивных и дискурсивных контекстах.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ