• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Автоматическое выделение двуязычных коллокаций из параллельных корпусов

ФИО студента: Кузнецова Валерия Андреевна

Руководитель: Малафеев Алексей Юрьевич

Кампус/факультет: Факультет гуманитарных наук (Нижний Новгород)

Программа: Фундаментальная и прикладная лингвистика (Бакалавриат)

Год защиты: 2021

В настоящее время область автоматической обработки естественного языка стремительно развивается. В особенности большое внимание уделяется феномену коллокаций, сферами применения которых являются машинный перевод, распознавание речи и обучение иностранному языку. При этом получение объемного списка мультиязычных коллокаций является трудоемким и требует лексикографических компетенций. Автоматические инструменты позволяют быстро решить поставленную задачу с достаточной точностью. В этой связи применение подобных инструментов является актуальным, так как они облегчают процесс выделения устойчивых выражений, впоследствии повышают эффективность лингвистических исследований и способствуют созданию словарей нового типа и учебных материалов. Необходимо подчеркнуть, что в области извлечения одноязычных коллокаций было проведено большое количество исследований, в том числе на немецком и английском языках. Однако извлечение эквивалентных двуязычных коллокаций на данных языках является недостаточно разработанным направлением. В рамках данной работы был разработан алгоритм для выделения англо-немецких коллокаций, который комбинирует три подхода: статистический, синтаксический методы и векторные представления слов. Точность выделения коллокаций составила 0,87.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ