О чем курс

Вы познакомитесь с концепцией MLOps. Поймете, как именно Data Scientist использует DevOps в своих решениях: в частности, технологии непрерывной интеграции CI/CD (Continious Integration, Continuous Delivery). Также вы попробуете самостоятельно создать пайплайн обучения ML-модели с помощью библиотеки AirFlow и версионировать эксперименты с помощью платформы MLFlow.

Цель этого курса — научиться поднимать необходимое окружение для ML-экспериментов и грамотно версионировать результаты.

Для кого

Интенсив будет полезен слушателям, интересующимся областью машинного обучения и DevOps.

Начальные требования:
 - знание Python на пользовательском уровне
 - знание Linux на базовом уровне (желательно)

 Спикер 

Елизавета Гаврилова
Senior ML Engineer

 

 - Выпускница магистратуры ВШЭ ФКН.
 - 3 года работала в американском трейдинговом стартапе Particle на позиции Data Scientist.
 - 2 года работала в крупнейшем французском ритейлере на позиции Senior ML engineer.
 - Может упаковать исследование в продукт, учит писать красивый и оптимизированный код.

Сферы профессиональных интересов: ML engineering, MLOps, DevOps

Программа

 

  • 15.09 | 18:00-19:30

    — MLOps интро. MLOps для регулярного обучения моделей: обзор стека AirFlow+MLFlow+S3

  • 22.09 | 18:00-19:30

    — Виртуальные машины и виртуальные окружения. Сетап необходимой инфраструктуры: установка и настройка AirFlow, MLFlow, S3.

  • 29.09 | 18:00-19:30

    — Что такое DAG? Мой первый DAG для обучения модели: из чего состоит пайплайн обучения?

  • 06.10 | 18:00-19:30

    — Обучение нескольких моделей одновременно. Чтение и хранение данных на S3.

  • 13.10 | 18:00-19:30

    — Установка и настройка MLFlow. Повторяем эксперимент, но теперь версионируем с помощью MLFlow.

  • 20.10 | 18:00-19:30

    — Обзор финального задания. Подводя итоги: сравнение кастомного версионирования с готовым решением MLFlow.