• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Анализ данных для лингвистов

Направление: 45.03.03. Фундаментальная и прикладная лингвистика
Когда читается: 3-й курс, 3 модуль
Формат изучения: Full time
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Задачей курса «Анализ данных для лингвистов» является продолжение знакомства с различными методами анализа данных. Курс разделен на несколько тематических блоков: первый связан с применением байесовских статистических методов (байесовский апдейт, байесовский доверительный интервал, байесовский фактор, байесовкская эмпирическая оценка), второй связан с методами уменьшения размерности (PCA, LDA, CA, MCA), третий блок связан с методами кластеризации (k-means, иерархическая кластеризация, смешанные модели) и последний блок будет посвящен проблемам применения регрессионного анализа (регрессия со смешанными эффектами, обобщённая аддитивная модель).
Цель освоения дисциплины

Цель освоения дисциплины

  • знать особенности работы R, основные особенности анализа различных типов данных
  • познакомиться с основами методами анализа данных
  • владеть навыками самостоятельного анализа данных, а также критической интерпретации анализа данных, представленной в научных работах
Результаты освоения дисциплины

Результаты освоения дисциплины

  • Знает, чем наука о данных отличается от машинного обучения и статистики
  • Владеет основами языка программирования R
  • Владеет методами обработки данных
  • Владеет методом анализа строк
  • Владеет методами визуализации данных
  • Знает лингвистические пакеты на R
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Статистические распределения
  • Бейесовский вывод
  • Байесовский анализ биномиальных и нормально распределенных данных
  • Байесовский доверительный интервал
  • Уменьшение размерностей: PCA, LDA, CA, DCA, MCA
  • Продвинутый регрессионный анализ
Элементы контроля

Элементы контроля

  • неблокирующий Created with Sketch. Домашние задания
    Все элементы контроля подлежат пересдаче в виде 2-ух часовой контрольной работы по всем темам, во время которой можно пользоваться любыми материалами. Время проведения устанавливается факультетом гуманитарных наук. Тематический состав КИМ-ов для пересдач не отличается от тематического состава КИМ-ов текущего контроля и промежуточной аттестации.
  • неблокирующий Created with Sketch. Домашние задания
    Все элементы контроля подлежат пересдаче в виде 2-ух часовой контрольной работы по всем темам, во время которой можно пользоваться любыми материалами. Время проведения устанавливается факультетом гуманитарных наук. Тематический состав КИМ-ов для пересдач не отличается от тематического состава КИМ-ов текущего контроля и промежуточной аттестации.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    Итоговая оценка = 1/8.68 * \int_{0}^{x} x^1.3 + b, где x = среднее арифметическое оценок за дз, b - дополнительный балл за умение студента правильно посчитать в R свою оценку по курсу.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Fox, J., Jr, & Weisberg, H. S. (2010). An R Companion to Applied Regression. Thousand Oaks: SAGE Publications, Inc. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1236075

Рекомендуемая дополнительная литература

  • Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131