• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Нейронные сети в иерархическом обучении с подкреплением

ФИО студента: Кузьмин Вадим Тимофеевич

Руководитель: Панов Александр Игоревич

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Прикладная математика (Бакалавриат)

Год защиты: 2018

Одними из проблем обучения с подкреплением (RL) являются «проклятье размерности» и среды с разреженным откликом. Для их решения может быть использовано иерархическое обучение с подкреплением, которое позволяет осуществлять абстракцию над действиями и одновременно абстракцию над состояниями среды. В данной работе предложен алгоритм, объединяющий иерархический подход к обучению с подкреплением и способность искусственных нейронных сетей служить универсальными аппроксиматорами функций. Для реализации иерархии действий используется алгоритм «Options», смысл которого заключается в нахождении макро-действий (навыков), которые характеризуются собственной последовательностью действий и целью и позволяют более эффективно находить решение исходной задачи. Сверточная нейронная сеть, принимая на вход изображение, может выполнять роль Q-функции, когда на выходе для каждого возможного действия даётся оценка его полезности в данном состоянии среды. Разработанный алгоритм сравнивается с алгоритмом табличного Q-обучения в задаче построения башни из кубиков с помощью руки-робота.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ