• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Верхние границы в обучении с подкреплением

ФИО студента: Левин Илья Валерьевич

Руководитель: Наумов Алексей Александрович

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2021

Обучение с подкреплением является очень общим подходом в машинном обучении. В нем присутствуют многие другие подобласти, такие как основанные на модели и свободные от модели, которые в свою очередь делятся на другие виды. В обычной постановке, агент пытается найти лучший способ взаимодействия со средой, получая награду за свои действия. Поэтому агент стремится найти лучшую стратегию или другими словами оптимальную стратегию. Для некоторых стратегий трудно решить, является ли она оптимальной или нет. В этой работе представлен подход для построения верхнего решение для оптимальной функции значений. Это решение обладает свойством, что чем ближе наша политика к оптимальной, тем уже зазор между верхней и нижней границами. Это помогает нам измерять качество политики агента. Алгоритм для верхних границ работает как для MDP с конечным горизонтом, так и для бесконечного горизонта. Также предложенный алгоритм является не зависящим от модели, поэтому его можно использовать во многих практических задачах.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ