• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Корпусные методы исследований языковых процессов

Лучший по критерию «Новизна полученных знаний»
Направление: 45.04.02. Лингвистика
Когда читается: 1-й курс, 2 модуль
Формат изучения: без онлайн-курса
Преподаватели: Попова Дарья Павловна
Прогр. обучения: Языковая политика в условиях этнокультурного разнообразия
Язык: русский
Кредиты: 3
Контактные часы: 32

Программа дисциплины

Аннотация

Дисциплина «Корпусные методы исследований языковых процессов» относится к блоку обязательных дисциплин программы. В результате освоения данного курса студент будет уметь работать с корпусными данными, критически оценивать использование статистических методов, владеть навыками программирования на языке R и уметь применять статистические методы для анализа данных. Эти навыки могут быть использованы студентом в дальнейшем при подготовке рефератов, написании курсовых, статей, проектов.
Цель освоения дисциплины

Цель освоения дисциплины

  • • знакомство с лингвистическими и социолингвистическими корпусами; • знакомство с принципами аннотирования лингвистических и социолингвистических данных и с проблемами, возникающими при аннотировании данных; • изучение основ квантитативного анализа в социолингвистике; • ознакомление с возможностями квантитативных подходов в социолингвистике и с проблемами, с которыми они сталкиваются; • умение формулировать исследовательские вопросы и представлять их в виде гипотез, которые можно протестировать квантитативными методами; • умение критически оценивать качество статистического анализа; • умение применять подходящие для целей исследования статистические методы к данным; • умение программировать в R для самостоятельного решения исследовательских задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • умеет осуществлять поиск в существующих корпусах
  • владеет терминами корпусной лингвистики
  • владеет основными методами статистического анализа данных
  • владеет методами графической репрезентации данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Корпусные исследования
    Основные понятия корпусных исследований: корпус, аннотация (разметка), поиск. Знакомство с существующими лингвистическими и социолингвистическими корпусами. Область применения корпусных исследований. Проблемы, возникающие при проведении корпусных исследований.
  • Статистические методы обработки корпусных данных
    Знакомство с R. Понятие случайной величины. Представление данных, сортировка данных в столбцах, строках. Форматы данных. Простые графики. Понятие статистического распределения. Виды распределений. Нормальное распределение, распределения t, F, χ2. Тесты для определения вида распределения. Зависимые и независимые переменные. Линейная регрессия. Ковариантность. Статистическая значимость. Кластеризация – метод главных компонент, факторный анализ, иерархический кластерный анализ, correspondence analysis, multi-dimensional scaling. Классификация -- классификационные деревья. Моделирование регрессии. Использование моделей со смешанным эффектом.
Элементы контроля

Элементы контроля

  • неблокирующий тест 1
  • неблокирующий домашнее задание 1
  • неблокирующий тест 2
  • неблокирующий домашнее задание 2
  • неблокирующий финальный проект
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.2 * домашнее задание 1 + 0.2 * домашнее задание 2 + 0.1 * тест 1 + 0.1 * тест 2 + 0.4 * финальный проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Грудева Е.В. - Корпусная лингвистика: учебное пособие - Издательство "ФЛИНТА" - 2017 - 165с. - ISBN: 978-5-9765-1497-3 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/106859
  • Теория вероятностей и математическая статистика : Учеб. пособие для студентов, Шведов, А. С., 1995

Рекомендуемая дополнительная литература

  • Математическая статистика. Оценка параметров. Проверка гипотез : учеб. пособие для вузов, Боровков, А. А., 1984