► О чем курс
Вы познакомитесь с концепцией MLOps. Поймете, как именно Data Scientist использует DevOps в своих решениях: в частности, технологии непрерывной интеграции CI/CD (Continious Integration, Continuous Delivery). Также вы попробуете самостоятельно создать пайплайн обучения ML-модели с помощью библиотеки AirFlow и версионировать эксперименты с помощью платформы MLFlow.
Цель этого курса — научиться поднимать необходимое окружение для ML-экспериментов и грамотно версионировать результаты.
► Для кого
Интенсив будет полезен слушателям, интересующимся областью машинного обучения и DevOps.
Начальные требования:
- знание Python на пользовательском уровне
- знание Linux на базовом уровне (желательно)
► Спикер
Елизавета Гаврилова
Senior ML Engineer
- Выпускница магистратуры ВШЭ ФКН.
- 3 года работала в американском трейдинговом стартапе Particle на позиции Data Scientist.
- 2 года работала в крупнейшем французском ритейлере на позиции Senior ML engineer.
- Может упаковать исследование в продукт, учит писать красивый и оптимизированный код.
Сферы профессиональных интересов: ML engineering, MLOps, DevOps
► Программа
-
15.09 | 18:00-19:30
— MLOps интро. MLOps для регулярного обучения моделей: обзор стека AirFlow+MLFlow+S3
-
22.09 | 18:00-19:30
— Виртуальные машины и виртуальные окружения. Сетап необходимой инфраструктуры: установка и настройка AirFlow, MLFlow, S3.
-
29.09 | 18:00-19:30
— Что такое DAG? Мой первый DAG для обучения модели: из чего состоит пайплайн обучения?
-
06.10 | 18:00-19:30
— Обучение нескольких моделей одновременно. Чтение и хранение данных на S3.
-
13.10 | 18:00-19:30
— Установка и настройка MLFlow. Повторяем эксперимент, но теперь версионируем с помощью MLFlow.
-
20.10 | 18:00-19:30
— Обзор финального задания. Подводя итоги: сравнение кастомного версионирования с готовым решением MLFlow.