Магистратура
2025/2026




MLOps
Статус:
Курс обязательный (Аналитика больших данных)
Где читается:
Факультет компьютерных наук
Когда читается:
2-й курс, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
28
Программа дисциплины
Аннотация
Дисциплина знакомит студентов с инженерной стороной машинного обучения — принципами организации воспроизводимых экспериментов, контейнеризацией окружений, управлением пайплайнами и моделями.
Особое внимание уделено практическим инструментам, которые применяются в индустрии: Linux, Docker, Docker Compose, GitHub Actions и MLflow.
Курс рассчитан на студентов, не имеющих глубоких DevOps-навыков, и построен по принципу "от окружения к воспроизводимым ML-процессам".
Цель освоения дисциплины
- 1. Сформировать базовые навыки работы в Linux и командной строке.
- 2. Научить контейнеризировать приложения и ML-окружения с помощью Docker.
- 3. Понять основы автоматизации и CI/CD с использованием GitHub Actions.
- 4. Освоить работу с MLflow: трекинг экспериментов, хранение моделей и развёртывание.
- 5. Научиться строить end-to-end пайплайны в Docker, включая логирование и простейший мониторинг.
- 6. Познакомиться с архитектурой Kubernetes и принципами оркестрации контейнеров.
Планируемые результаты обучения
- владеть принципами MLOps и жизненным циклом ML-моделей;
- владеть основами Linux, Docker, CI/CD и MLflow;
- умеет работать в терминале Linux и использовать bash-скрипты;
- создает и запускает контейнеры Docker и Docker Compose;
- логирует эксперименты и управляет моделями через MLflow;
- - автоматизировать тесты и сборку через GitHub Actions;
- владеет навыками сборки воспроизводимых ML-окружений;
- владеет навыками развёртывания моделей через MLflow Model Serving;
- владеет навыками минимального мониторинга пайплайнов в контейнерах.
Содержание учебной дисциплины
- Введение в MLOps и архитектуру ML-систем
- Структура и инструменты проекта машинного обучения
- Основы Linux (часть 2)
- Контейнеризация и Docker (часть 1)
- Docker (часть 2): Dockerfile и оптимизация
- Docker Compose и многосервисные окружения
- Основы Git и CI/CD на GitHub Actions
- Введение в MLflow
- MLflow Tracking и артефакты
- MLflow Model Registry и Serving
- End-to-End пайплайн в Docker
- Мониторинг и Observability
- Введение в Kubernetes (часть 1)
- Введение в Kubernetes (часть 2)
Промежуточная аттестация
- 2025/2026 2nd module0.5 * Домашнее задание 1 (Linux + Docker) + 0.5 * Домашнее задание 2 (MLflow)
Список литературы
Рекомендуемая основная литература
- Noah Gift, & Alfredo Deza. (2021). Practical MLOps: Vol. First edition. O’Reilly Media.
- Платонов, А. В. Машинное обучение : учебное пособие для вузов / А. В. Платонов. — Москва : Издательство Юрайт, 2024. — 85 с. — (Высшее образование). — ISBN 978-5-534-15561-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/544780 (дата обращения: 04.07.2025).
- Харенслак, Б. Apache Airflow и конвейеры обработки данных / Б. Харенслак, Р. Д. де , перевод с английского Д. А. Беликова. — Москва : ДМК Пресс, 2022. — 502 с. — ISBN 978-5-97060-970-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241133 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- 16742 - Введение в статистическое обучение с примерами на языке R. Изд. второе, испр. - Г. Джеймс; Д.Уиттен; Р.Тибширани; Т.Хасти - ДМК Пресс - 2017 - https://hse.alpinadigital.ru/document/16742 - Alpina
- 24329 - Машинное обучение с участием человека - Р.Монарх - ДМК Пресс - 2022 - https://hse.alpinadigital.ru/document/24329 - Alpina
- Криволапов, С. Я., Статистические вычисления на платформе Jupyter Notebook с использованием Python : учебник / С. Я. Криволапов. — Москва : КноРус, 2022. — 431 с. — ISBN 978-5-406-09739-7. — URL: https://book.ru/book/943660 (дата обращения: 04.07.2025). — Текст : электронный.