• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2021/2022

Современные методы анализа данных: машинное обучение

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 1-й курс, 2, 3 модуль
Формат изучения: с онлайн-курсом
Охват аудитории: для своего кампуса
Преподаватели: Максимовская Анастасия Максимовна, Рысьмятова Анастасия Александровна
Прогр. обучения: Машинное обучение и высоконагруженные системы
Язык: русский
Кредиты: 7
Контактные часы: 36

Программа дисциплины

Аннотация

Студенты узнают, как устроены решающие деревья и их композиции, узнают о некоторых методах кластеризации и снижения размерности, об основных подходах к решению задачи построения рекомендаций, а также получат первое представление о нейронных сетях.
Цель освоения дисциплины

Цель освоения дисциплины

  • Умеет обучать и оценивать качество большинства классических моделей машинного обучения
  • Умеет выбирать модель машинного обучения, исходя из особенностей задачи и данных
  • Умеет ориентироваться в существующих метриках качества и выбирать метрику, исходя из задачи и особенностей данных
  • Умеет решать как задачи обучения с учителем, так и задачи обучения без учителя
  • Умеет решать задачу построения рекомендаций
  • Умеет обучать полносвязную нейронную сеть в некоторых задачах
Планируемые результаты обучения

Планируемые результаты обучения

  • выбирает модель машинного обучения, исходя из особенностей задачи и данных
  • ориентируется в существующих метриках качества и выбирать метрику, исходя из задачи и особенностей данных
  • решает задачу построения рекомендаций
  • решает как задачи обучения с учителем, так и задачи обучения без учителя
  • умеет оценивать качество большинства классических моделей машинного обучения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Решающие деревья, счётчики
  • Бэггинг, разложение ошибки на шум-смещение-разброс
  • Бустинг
  • Практические штуки: блендинг, стекинг, методы измерения важности признаков (SHAP).
  • Современные имплементации бустинга
  • Методы кластеризации
  • Методы снижения размерности
  • Введение в нейронные сети
  • Рекомендательные системы
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Пятиминутки
  • неблокирующий Проект
  • неблокирующий Экзамен (письменный)
    Итог = Округление(0.15 * П + 0.3 * ДЗ + 0.4 * К + 0.15 * Э), где П - средняя оценка за пятиминутки - проверочные в начале каждого занятия, ДЗ - средняя оценка за домашние задания К - оценка за курсеру, Э - оценка за экзамен. Определим накопленную оценку как Накоп = Округление(0.15 * П + 0.3 * ДЗ + 0.4 * К) / 0.85. Если Накоп >= 7, то студент может получить Накоп в качестве итоговой оценки, не приходя на экзамен.
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 3 модуль
    0.3 * Домашнее задание + 0.15 * Пятиминутки + 0.4 * Проект + 0.15 * Экзамен (письменный)
Список литературы

Список литературы

Рекомендуемая основная литература

  • The elements of statistical learning : data mining, inference, and prediction, Hastie, T., 2017

Рекомендуемая дополнительная литература

  • Foundations of machine learning, Mohri, M., 2012
  • Pattern recognition and machine learning, Bishop, C. M., 2006