Бакалавриат
2025/2026
Обучение с подкреплением (углубленный курс)
Статус:
Курс по выбору (Прикладная математика и информатика)
Где читается:
Факультет компьютерных наук
Когда читается:
3-й курс, 3, 4 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
6
Контактные часы:
80
Программа дисциплины
Аннотация
Курс «Введение в обучение с подкреплением» рассматривает область обучения с подкреплением (Reinforcement Learning, RL) — одного из центральных направлений современного искусственного интеллекта. Он охватывает как базовые принципы и классические алгоритмы, так и современные методы, применяемые сегодня для решения задач в робототехнике, управлении, играх и обучении крупных нейросетевых моделей. Курс рассчитан на слушателей, знакомых с основами машинного обучения, методами оптимизации и базовыми нейросетевыми архитектурами.
В ходе курса студенты познакомятся с ключевыми идеями и алгоритмами RL — от фундаментальных подходов к оптимизации поведения до современных специализированных направлений. Первая часть курса посвящена базовым методам обучения с подкреплением, включая как табличные, так и нейросетевые реализации: методы на основе функции полезности (включая DQN и его модификации), прямую оптимизацию стратегии (Policy Gradient) и гибридные подходы семейства Actor–Critic. Во второй части будут рассмотрены отдельные специализированные области RL, такие как модельное обучение, офлайн- и имитационное обучение, целевое обучение (goal-conditioned) и другие. Курс предполагает знакомство с основными направлениями и их взаимосвязями, формируя целостное представление о современном обучении с подкреплением.
Курс сочетает теоретические лекции и практические занятия, на которых студенты реализуют ключевые алгоритмы и анализируют их поведение в интерактивных средах (на Python с использованием библиотеки Gymnasium). Такой формат позволяет не только освоить математические и интуитивные основы RL, но и получить практические навыки построения и оценки обучающихся агентов.