• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Выявление жанровых и авторских особенностей латинских текстов методами машинного обучения

ФИО студента: Ханнанов Шухрат Ильдусович

Руководитель: Файер Владимир Владимирович

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Год защиты: 2015

В данной работе изучаются характеристики латинских текстов, относящиеся к трем группам: жанровые, авторские и хронологические особенности. В последнем случае имеются в виду те атрибуты текста, которые связаны с грамматическими свойствами языка в то время, когда этот текст был написан. Изучение данных характеристик – устоявшаяся область классической филологии, однако в исследованиях, относящихся к этой области, сравнительно редко применяются различные квантитативные методы. Мы предлагаем новый подход к исследованию характеристик произведений, основанный, прежде всего, на автоматической обработке латинских текстов, извлечении из них числовых данных и установлении зависимостей между данными и характеристиками. Затем на основании этих зависимостей будут сделаны выводы, подтверждающие уже существующие теории, либо опровергающие их. Числовые данные основаны на лингвистических особенностях текстов, а установление зависимостей – на различных методах машинного обучения. В работе применяются два метода машинного обучения: классификация (используется алгоритм SVM) и кластеризация (используется иерархическая аггломеративная кластеризация, а также алгоритм «k-средние»). Выбранные алгоритмы реализованы на языке Python версии 2.7.8, также применялись сторонние программы. Полученные результаты показывают, что данные методы могут успешно выделить значительное количество исследуемых особенностей.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ