• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Обучение с подкреплением (углубленный курс)

Когда читается: 3-й курс, 3, 4 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 6
Контактные часы: 80

Программа дисциплины

Аннотация

Курс «Введение в обучение с подкреплением» рассматривает область обучения с подкреплением (Reinforcement Learning, RL) — одного из центральных направлений современного искусственного интеллекта. Он охватывает как базовые принципы и классические алгоритмы, так и современные методы, применяемые сегодня для решения задач в робототехнике, управлении, играх и обучении крупных нейросетевых моделей. Курс рассчитан на слушателей, знакомых с основами машинного обучения, методами оптимизации и базовыми нейросетевыми архитектурами. В ходе курса студенты познакомятся с ключевыми идеями и алгоритмами RL — от фундаментальных подходов к оптимизации поведения до современных специализированных направлений. Первая часть курса посвящена базовым методам обучения с подкреплением, включая как табличные, так и нейросетевые реализации: методы на основе функции полезности (включая DQN и его модификации), прямую оптимизацию стратегии (Policy Gradient) и гибридные подходы семейства Actor–Critic. Во второй части будут рассмотрены отдельные специализированные области RL, такие как модельное обучение, офлайн- и имитационное обучение, целевое обучение (goal-conditioned) и другие. Курс предполагает знакомство с основными направлениями и их взаимосвязями, формируя целостное представление о современном обучении с подкреплением. Курс сочетает теоретические лекции и практические занятия, на которых студенты реализуют ключевые алгоритмы и анализируют их поведение в интерактивных средах (на Python с использованием библиотеки Gymnasium). Такой формат позволяет не только освоить математические и интуитивные основы RL, но и получить практические навыки построения и оценки обучающихся агентов.