• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2019/2020

Современные методы анализа данных

Статус: Курс обязательный (Промышленное программирование)
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 1-й курс, 1-4 модуль
Формат изучения: Full time
Преподаватели: Гориховский Вячеслав Игоревич, Омельченко Александр Владимирович, Пусев Руслан Сергеевич
Прогр. обучения: Промышленное программирование
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

Целью освоения дисциплины «Современные методы анализа данных» является изучение основных аппаратов машинного обучения, эффективных алгоритмов обучения и применения обученных моделей, основ теории байесовского вывода. В результате изучения дисциплины у студента будет сформировано представление о современном состоянии дел в теории байесовского вывода. Студент получит также представление об основных методах машинного обучения, соответствующих алгоритмах вывода, вероятностных основах машинного обучения и соответствующих моделях. Изучение дисциплины будет способствовать как развитию вероятностной интуиции и разработке моделей и методов машинного обучения, так и практическому их применению.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Современные методы анализа данных» является основных аппаратов машинного обучения, эффективных алгоритмов обучения и применения обученных моделей.
Результаты освоения дисциплины

Результаты освоения дисциплины

  • Знает: главные методы, техники, темы и прикладные возможности. Владеет понятием анализа данных в различных прикладных областях. Знает этапы анализа данных. Знает: инструменты R, RStudio, Python (пакеты scipy и numpy, сборка Anaconda, Pandas, Scikit-learn и др.)
  • Владеет понятиями визуализации и агрегации данных: фильтрация, объединение, сортировка данных. Работает с датами и текстовыми данными. Оценивает параметры распределений. Знает метод максимального правдоподобия.
  • Владеет понятием статистического обучения в бизнесе, социологии, экономике. Знает возможности применения статистического обучения в информационных системах. Знает: классификационные и регрессионные деревья; линейную регрессию; квадратичную функцию потерь и предположение о нормальном распределении шума.
  • Владеет понятиями: объединения моделей; усреднение, бутстрап, бэггинг; бустинг: AdaBoost. Знает алгоритм Random Forest.
  • Знает модели, допускающие интерпретацию. Владдет понятием интерпретации моделей “черного ящика”. Владдет понятием глобальной интерпретации (знает важность признаков, ICE графики)
  • Знает проблему выявления причинно-следственных связей. Владеет понятиями: случайных экспериментов; выборки и смещения; мэтчинга. Знает оценки ATE, ATC
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение, основные понятия анализа данных
  • Выводы на основе данных: проверка гипотез и статистические тесты
  • Предсказания на основе данных. Классификация и регрессия
  • Ансамбли моделей
  • Интерпретация моделей
  • Причинно-следственные связи
Элементы контроля

Элементы контроля

  • неблокирующий Created with Sketch. Домашнее задание №1
  • блокирующий Created with Sketch. Экзамен
  • неблокирующий Created with Sketch. Домашнее задание №2
  • блокирующий Created with Sketch. Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.5 * Домашнее задание №1 + 0.5 * Экзамен
  • Промежуточная аттестация (4 модуль)
    0.5 * Домашнее задание №2 + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • - Вьюгин В.В. — Математические основы машинного обучения и прогнозирования - Московский центр непрерывного математического образования - 2014 - ISBN: 978-5-4439-2014-6 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/56397

Рекомендуемая дополнительная литература

  • Ahmed, S. E. (2017). Big and Complex Data Analysis : Methodologies and Applications. Cham, Switzerland: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1383914