• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Заимствования из русского языка в стандартном китайском: проблемы фонетической и морфологической адаптации и методы автоматического распознавания в китайских текстах

ФИО студента: Семенов Кирилл Игоревич

Руководитель: Орехов Борис Валерьевич

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Оценка: 10

Год защиты: 2020

В работе описываются основные аспекты адаптации русских заимствований в стандартном китайском языке (путунхуа). В первой части при помощи Теории оптимальности дается анализ фонетических трансформаций согласных, консонантных кластеров и гласных. Для исследования адаптации звонких щелевых согласных мы также провели психолингвистический эксперимент. Вторая часть посвящена описанию морфемных трансформаций в заимствованиях. В третьей части исследуется качество существующих алгоритмов китайского NLP для задачи вычленения русских заимствований. Исследование проведено на широком спектре прескриптивных и дескриптивных материалов. Мы использовали Словарь заимствований в китайском языке, экспериментальные данные, справочники по транслитерации русских слов, подвыборку данных китайской Википедии со статьями о русскоязычных странах, данные Большого русско-китайского словаря, подвыборку предложений из Русско-китайского параллельного корпуса НКРЯ. В результате исследования фонетического аспекта заимствований мы получили системное описание трансформаций, которое можно сравнить с результатами исследований по контактной фонетике на парах других языков. Так, несмотря на то, что основная часть формализмов, выделенных для описания адаптации английских заимствований в путунхуа, представляется справедливой и для русских заимствований, были обнаружены существенные расхождения в адаптации щелевых согласных и консонантных кластеров. В результате эксперимента актуальность этих расхождений была подтверждена. Исследование морфемной адаптации выявило ряд основных тенденций по преобразованию алломорфов и значимых морфем в русских заимствованиях. Результаты этого дескриптивного исследования можно в дальнейшем использовать для построения более общей модели адаптации заимствований, которая будет включать и морфемные преобразования. Сравнительный анализ алгоритмов китайского словоделения выявил наиболее эффективный сегментатор, отличающийся высоким качеством и удобством в использовании. Мы планируем учесть результат этого исследования для улучшения качества словоделения в Русско-китайском параллельном корпусе НКРЯ.

Текст работы (работа добавлена 30 мая 2020 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ