• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Неявные стратегии вознаграждения при формировании новых правил в обучении с подкреплением

ФИО студента: Цуканов Роман Валерьевич

Руководитель: Панов Александр Игоревич

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Прикладная математика (Бакалавриат)

Оценка: 9

Год защиты: 2018

В рамках данной работы, наша основная задача заключалась в разработке алгоритма обучения с подкреплением, позволяющему неявно задавать разным агентам разную функциональность. Решение не подразумевает получение агентом вознаграждения за выполнение требующейся от него задачи - обучение происходит в соответствии с выполнением общей цели. В рамках данного проекта, мы фокусируемся на основных методах представления систем с несколькими агентами при помощи классических алгоритмов обучения с подкреплением с одним агентом. Для проведения экспериментов, была создана среда «ARM», позволяющая моделировать взаимодействие нескольких манипуляторов, способных перемещать ящики разных типов в двумерном пространстве. Для поиска оптимальной стратегии поведения агентов, был выбран популярный алгоритм «Актер-Критик», использующий нейронные сети для аппроксимации функций «Актера» и «Критика».

Текст работы (работа добавлена 25 мая 2018 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ