• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Оценка распределений вероятностей с помощью градиентной оптимизации в пространстве Wasserstein

ФИО студента: Семенков Илья Владимирович

Руководитель: Пари Кентан Поль Бернар

Кампус/факультет: Факультет компьютерных наук

Программа: Науки о данных (Магистратура)

Год защиты: 2021

Данная работа посвящена задаче оценки абсолютно непрерывной вероятностной меры в контексте онлайн оптимизации в пространстве Wasserstein. Более того, в общей формулировке рассматриваемой задачи предполагается, что мера может незначительно меняться во времени между итерациями. Чтобы добиться эффективного алгоритма для решения поставленной задачи, она была переформулирована в терминах оптимального транспорта. Для этого была использована связь между расстоянием Вассерштейна и оптимальным транспортом. В процессе формулировки задачи была добавлена энтропическая регуляризация для повышения эффективности работы алгоритма. Далее, была применена теорема о двойственности задачи оптимального транспорта. После этого, оказалось возможным применить c-трансформацию потенциалов Канторовича, что привело к упрощению задачи до минимакс оптимизации в конечномерном пространстве. Было доказанно, что в общем контексте данная задача принадлежит к классу невыпуклой-вогнутой минимакс оптимизации. Основываясь на алгоритме градиентного спуска-подъёма, который часто применяется в таких задачах, был разработан алгоритм оценки плотности вероятности в контексте онлайн оптимизации. Далее алгоритм был запрограммирован. Для оценки качества его работы был проведён ряд тестов с использованием разных сгенерированных выборок и истинных распределений. В частности, были проведены тесты для нормального, экспоненциального распределения и степенного закона. Более того, было протестировано поведение алгоритма на наборе данных сгенерированных нормальных распределением с монотонно меняющимся между итерациями средним; и экспоненциальным распределением с добавлением шума в параметр (каждая точка сгенерирована параметром с разным значением случайной величины – шума). Алгоритм показал множество значимых результатов на ряде использованных данных. Ключевые слова: оценка распределения по выборке, полудискретный оптимальный транспорт, онлайн обучение, неидентичное распределение данных

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ