• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Исследование скорости речи на материале корпусов звучащей речи языков Росcии.

ФИО студента: Терехина Мария Дмитриевна

Руководитель: Мороз Георгий Алексеевич

Кампус/факультет: Факультет гуманитарных наук

Программа: Фундаментальная и компьютерная лингвистика (Бакалавриат)

Оценка: 10

Год защиты: 2019

После исследований индивидуальных различий в скорости речи, начали появляться более общие исследования. Основной их задачей было измерение скорости речи языка в целом и типологическое сравнение языков по этому параметру. Все эти работы основаны на предположении, что скорость речи является лингво-специфичным параметром, значение которого варьируется от языка к языку. С этой точки зрения, скорости речи носителей зависит от этого лингво-специфичного параметра. Противоположная точка зрения состоит в том, что наблюдаемая изменчивость в индивидуальной скорости речи только частично зависит (или не зависит вовсе) от языка говорящего, а основными факторами, влияющими на скорость речи, являются индивидуальные характеристики говорящего (возраст, пол и т.д.) и дискурс-специфичные характеристики речи (длина фразы в слогах, эмоциональность речи и т. д.). Эта работа исследует релевантность скорости речи как типологического параметра. Гипотеза заключается в том, что язык как параметр не влияет на индивидуальную скорость речи говорящего. Чтобы подтвердить эту гипотезу, я изучаю индивидуальные скорости речи носителей русского, азербайджанского, башкирского, бесермянского диалекта удмуртского языка и чукотского языков. Анализ основан на данных из разговорных корпусов этих языков. Используя эти данные, я разработала несколько статистических моделей co смешанными эффектами, представляющих различные предположения относительно структуры данных и важности факторов. Модели со смешанными эффектами использовались из-за отсутствия независимости между наблюдениями, так как одно наблюдение в выборке соответствует одному высказыванию, от одного говорящего всегда больше одного наблюдения. Независимость наблюдений является одним из фундаментальных допущений регрессионного анализа. Модели со смешанными эффектами позволяют использовать регрессионный анализ в ситуации нарушения независимости. Было построено шесть моделей, сгруппированных в пары. Каждая пара имела свою комбинацию случайных и фиксированных эффектов. Внутри пары модели различались только по наличию/отсутствию фактора языка в качестве случайного эффекта. В соответствии с гипотезой, ожидалось, что модели без случайного эффекта языка будут описывать данные как минимум не хуже, чем модели с этим эффектом. Результаты статистического сравнения моделей не подтверждают выдвинутую гипотезу: модель, содержащая эффект языка, описывала данные значительно лучше, чем модели, не содержащие его. С другой стороны, значение оценки фиксированного эффекта (длина высказывания в слогах), представленная для этой модели, ниже лингвистической значимости для большей части данных. Следовательно, эти модели должны быть обучены на большем количестве данных, что может усилить уже обнаруженную зависимость или выявить новые. До тех пор я не считаю возможным окончательно подтвердить или опровергнуть гипотезу о нерелевантности скорости речи как типологического параметра. Тем не менее, в настоящей работе представлен алгоритм изучения различных языковых параметров с точки зрения их влияния на индивидуальные характеристики говорящего. Используя его, можно предоставить строгие доказательства за или против языковых обобщений разных уровней.

Текст работы (работа добавлена 4 июня 2019 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ