Магистратура
2020/2021
Корпусные методы исследований языковых процессов
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Языковая политика в условиях этнокультурного разнообразия)
Направление:
45.04.02. Лингвистика
Кто читает:
Школа филологических наук
Где читается:
Факультет гуманитарных наук
Когда читается:
1-й курс, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Попова Дарья Павловна
Прогр. обучения:
Языковая политика в условиях этнокультурного разнообразия
Язык:
русский
Кредиты:
3
Контактные часы:
32
Программа дисциплины
Аннотация
Дисциплина «Корпусные методы исследований языковых процессов» относится к блоку обязательных дисциплин программы. В результате освоения данного курса студент будет уметь работать с корпусными данными, критически оценивать использование статистических методов, владеть навыками программирования на языке R и уметь применять статистические методы для анализа данных. Эти навыки могут быть использованы студентом в дальнейшем при подготовке рефератов, написании курсовых, статей, проектов.
Цель освоения дисциплины
- • знакомство с лингвистическими и социолингвистическими корпусами; • знакомство с принципами аннотирования лингвистических и социолингвистических данных и с проблемами, возникающими при аннотировании данных; • изучение основ квантитативного анализа в социолингвистике; • ознакомление с возможностями квантитативных подходов в социолингвистике и с проблемами, с которыми они сталкиваются; • умение формулировать исследовательские вопросы и представлять их в виде гипотез, которые можно протестировать квантитативными методами; • умение критически оценивать качество статистического анализа; • умение применять подходящие для целей исследования статистические методы к данным; • умение программировать в R для самостоятельного решения исследовательских задач.
Планируемые результаты обучения
- умеет осуществлять поиск в существующих корпусах
- владеет терминами корпусной лингвистики
- владеет основными методами статистического анализа данных
- владеет методами графической репрезентации данных
Содержание учебной дисциплины
- Корпусные исследованияОсновные понятия корпусных исследований: корпус, аннотация (разметка), поиск. Знакомство с существующими лингвистическими и социолингвистическими корпусами. Область применения корпусных исследований. Проблемы, возникающие при проведении корпусных исследований.
- Статистические методы обработки корпусных данныхЗнакомство с R. Понятие случайной величины. Представление данных, сортировка данных в столбцах, строках. Форматы данных. Простые графики. Понятие статистического распределения. Виды распределений. Нормальное распределение, распределения t, F, χ2. Тесты для определения вида распределения. Зависимые и независимые переменные. Линейная регрессия. Ковариантность. Статистическая значимость. Кластеризация – метод главных компонент, факторный анализ, иерархический кластерный анализ, correspondence analysis, multi-dimensional scaling. Классификация -- классификационные деревья. Моделирование регрессии. Использование моделей со смешанным эффектом.
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.2 * домашнее задание 1 + 0.2 * домашнее задание 2 + 0.1 * тест 1 + 0.1 * тест 2 + 0.4 * финальный проект
Список литературы
Рекомендуемая основная литература
- Грудева Е.В. - Корпусная лингвистика: учебное пособие - Издательство "ФЛИНТА" - 2017 - 165с. - ISBN: 978-5-9765-1497-3 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/106859
- Теория вероятностей и математическая статистика : Учеб. пособие для студентов, Шведов, А. С., 1995
Рекомендуемая дополнительная литература
- Математическая статистика. Оценка параметров. Проверка гипотез : учеб. пособие для вузов, Боровков, А. А., 1984