• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Прикладная математика и информатика»

Прикладная статистика в машинном обучении

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты
Статус:
Курс по выбору
Когда читается:
3-й курс, 1, 2 модуль

Преподаватели

Программа дисциплины

Аннотация

Курс “Прикладная статистика в машинном обучении” составлен для студентов 3-го курса ОП ПМИ. Основная задача курса – познакомить студентов с многообразием статистических инструментов, которые используются для моделирования и анализа явлений, возникающих в прикладных задачах в различных областях. Особое внимание будет уделено регрессионному анализу, обсуждению моделей, учитывающих тип и специфические особенности данных (например, гетероскедастичность или эндогенность), методам проверки гипотез и корректной интерпретации результатов. Курс будет полезен всем, кто хочет научиться построению интерпретируемых статистических моделей для проведения эмпирических исследований.
Цель освоения дисциплины

Цель освоения дисциплины

  • ознакомить студентов с базовыми статистическими методами
  • сформировать у студентов навыки работы с данными и решения прикладных задач
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь выбирать спецификацию модели, подходящую для учета выявленных особенностей.
  • Уметь выявлять особенности данных, которые могут повлиять на результаты оценки моделей, при помощи различных статистических тестов.
  • Уметь задавать и оценивать статистические модели, а также интерпретировать их результаты.
  • Уметь использовать универсальные статистические инструменты (например, бутстрэп).
  • Уметь получать точечные и интервальные оценки, задавать и тестировать гипотезы.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Энтропия и дивергенция Кульбака-Лейблера, AIC
  • Метод максимального правдоподобия
  • Тесты LR, LM, W
  • EM-алгоритм
  • Бутстрэп
  • Нормальное распределение, t-распределение, хи-квадрат распределение, F-распределение. F-тест.
  • Гетероскедастичность и бутстрэп
  • Нестандартные регрессии
  • Непараметрическое оценивание (таблицы сопряжённости, категориальные переменные)
  • Байесовский подход. Байесовский фактор
  • Алгоритм Метрополиса-Гастингса
  • Variational Inference
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа (мидтерм)
  • неблокирующий Домашняя работа 1
  • неблокирующий Домашняя работа 2
  • неблокирующий Экзамен
  • неблокирующий Квизы
    Проверочные работы на семинаре.
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 2 модуль
    0.4 * Экзамен + 0.24 * Контрольная работа (мидтерм) + 0.12 * Домашняя работа 1 + 0.12 * Квизы + 0.12 * Домашняя работа 2
Список литературы

Список литературы

Рекомендуемая основная литература

  • An Introduction to the Bootstrap, Efron, B., 1993
  • Наглядная математическая статистика : учеб. пособие для вузов, Лагутин, М. Б., 2019
  • Прикладная математическая статистика : для инженеров и научных работников, Кобзарь, А. И., 2006
  • Прикладная статистика в задачах и упражнениях : учебник для вузов, Айвазян, С. А., 2001
  • Теория случайных процессов, Булинский, А. В., 2003
  • Эконометрика : учеб. пособие для вузов, Айвазян, С. А., 2010

Рекомендуемая дополнительная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Shay Cohen. (2019). Bayesian Analysis in Natural Language Processing : Second Edition. San Rafael: Morgan & Claypool Publishers. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2102157
  • Методы эконометрики : учебник для вузов, Айвазян, С. А., 2010