• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2019/2020

Машинное обучение

Направление: 01.04.04. Прикладная математика
Когда читается: 1-й курс, 1, 2 модуль
Формат изучения: Full time
Прогр. обучения: Системы управления и обработки информации в инженерии
Язык: английский
Кредиты: 3

Course Syllabus

Abstract

Целями освоения дисциплины «Машинное обучение» являются развитие магистрантом навыков решения задач машинного обучения, с использованием современных вычислительной техники, программного обеспечения и языка программирования Python. Результат освоения дисциплины - умение создавать модели машинного обучения на основе информации по темам курса (компетенции ОПК-2, ПК-4, ПК-7). Охват предметной области: основные задачи машинного обучения, методы их решения, работа с широко известными библиотеками машинного обучения.
Learning Objectives

Learning Objectives

  • Развитие магистрантом навыков решения задач машинного обучения, с использованием современных вычислительной техники, программного обеспечения и языка программирования Python.
Expected Learning Outcomes

Expected Learning Outcomes

  • Чтение данных, предобработка данных. Использование библиотек Pandas, NumPy.
  • Создание простых моделей машинного обучения. Использование библиотеки scikit-learn
  • Создание ансамблей. Использование библиотек xgboost, Microsoft LightGBM, CatBoost
  • Приемы устранения переобучения моделей, гипероптимизация параметров.
Course Contents

Course Contents

  • Постановка задач машинного обучения. Задачи классификации, регрессии, кластеризации. Подготовка данных. Библиотеки Pandas, NumPy. Метрики качества прогнозов.
    Задачи машинного обучения. Обучающая выборка. Обучение с учителем, обучение без учителя. Задачи классификации, регрессии, кластеризации. Использование языка программирования Python, методы установки необходимых библиотек. Библиотеки Pandas, NumPy. Подготовка обучающей выборки. DataFrame (Series), атрибуты и методы DataFrame, извлечение срезов. DataFrameGroupBy, атрибуты и методы DataFrameGroupBy. Библиотека scikit-learn. Метрики классификации, регрессии и кластерные метрики.
  • Методы часть 1. Линейная модель, метод опорных векторов, метод ближайших соседей, деревья регрессии и классификации. Модели нейронных сетей. Библиотека scikit-learn.
    Метод наименьших квадратов. Библиотека scikit-learn. Линейная регрессия. Логистическая регрессия. Регуляризация l1 и l2. Гребневая регрессия. Метод опорных векторов. Метод ближайших соседей. Деревья регрессии и классификации. Модели нейронных сетей. Многослойный перцептрон.
  • Методы часть 2. Бустинг, Баггинг. Библиотеки xgboost, Microsoft LightGBM, CatBoost (Яндекс)
    Понятие бустинг и баггинг. Градиентный бустинг. Библиотеки xgboost, Microsoft LightGBM, CatBoost (Яндекс).
  • Методы часть 3. Валидация, кросс валидация. Стекинг. Гипероптимизация параметров. Онлайн обучение.
    Валидация, кросс-валидация. Стекинг. Гипероптимизация параметров. Онлайн обучение.
Assessment Elements

Assessment Elements

  • non-blocking Аудиторная работа
  • non-blocking Самостоятельная работа
  • non-blocking Итоговый экзамен
  • non-blocking Контрольно-измерительные материалы
Interim Assessment

Interim Assessment

  • Interim assessment (2 module)
    0.3 * Аудиторная работа + 0.4 * Итоговый экзамен + 0.3 * Самостоятельная работа
Bibliography

Bibliography

Recommended Core Bibliography

  • McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
  • Изучаем Python, Лутц М., Киселева А., 2014
  • Теория вероятностей и математическая статистика : учебник для вузов, Колемаев В. А., Калинина В. Н., 1999

Recommended Additional Bibliography

  • Romano, F. (2015). Learning Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1133614