• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Методы оптимизации в обучении с подкреплением

ФИО студента: Сюй Хаоян -

Руководитель: Сироткин Александр Владимирович

Кампус/факультет: Санкт-Петербургская школа физико-математических и компьютерных наук

Программа: Анализ больших данных в бизнесе, экономике и обществе (Магистратура)

Год защиты: 2020

С непрерывными исследованиями по обучению с подкреплением появляется все больше и больше типов алгоритмов обучения с подкреплением, задачи становятся все более и более сложными, и все труднее настраивать параметры. Существует все больше и больше алгоритмов для обучения с подкреплением, производительность становится все более и более сложной, а алгоритм - более сложным. Возникает все больше и больше проблем, настройка алгоритма становится все более и более сложной, и применимость алгоритма также нестабильна. Поэтому алгоритм оптимизации параметров стал важной задачей. Применимость алгоритма к различным средам также очень различна. в этой статье использует три классических алгоритма обучения подкрепления с DQN, DDPG, PPO в средах cartpole-v0 и Pendulum-v0. Десять методов оптимизации применяются к этим трем видам обучения подкреплению в двух игровых средах. Обобщите методы методов оптимизации обучения с подкреплением, сравните эффективность этих десяти методов оптимизации и оптимизируйте более эффективные алгоритмы на основе базовых алгоритмов.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ