Обучение с подкреплением для сред с разреженными действиями

ФИО студента: Пыркин Дмитрий Владимирович

Руководитель: Лобачева Екатерина Максимовна

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2019

Внутренний сигнал награды играет важную роль в эффективном исследовании среды в рамках задач глубинного обучения с подкреплением. Однако для использования внутреннего сигнала награды необходимо сбалансировать его с внешним сигналом награды. Переоценка внутреннего сигнала награды может привести к тому, что агент отойдёт от первоначальных задач среды. Данная нестабильность вызвана тем, что агент максимизирует взвешенную сумму внешнего и внутреннего сигнала награды. Данная работа предлагает новый подход к комбинированию внешнего и внутреннего сигнала награды. Предложенный подход позволяет использовать внутренний сигнал наград вместе с пределом отклонения агента от текущей стратегии в течение одного эпизода. Эффективность данного метода будет продемонстрирована как на дискретный, так и на континуальный окружениях.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ