Диссертации, представленные на защиту и подготовленные в НИУ ВШЭ

Сортировка:по дате защитыпо имени научного руководителяпо имени соискателя

Показаны работы: 1 - 10 из 19

Приложение машинного обучения к теоретико-игровым задачам: аукционы и марковские игрыКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Иванов Дмитрий Игоревич

Руководитель:

Нестеров Александр Сергеевич

Дисс. совет:

Совет по компьютерным наукам

В последние годы методы машинного обучения все чаще применяются для решения экономических и теоретико-игровых задач. В то же время, задачи машинного обучения с множеством агентов или пользователей могут быть формализованы и проанализированы с помощью теории игр. Данная диссертация состоит из трех независимых исследований на стыке этих областей и касается следующих тем: 1) применение методов глубокого обучения к дизайну экономических механизмов (аукционов), 2) адаптация теоретико-игрового концепта медиаторов к мультиагентному обучению с подкреплением в контексте марковских игр и 3) персонализация моделей глубокого обучения с подкреплением с целью максимизации общественного благосостояния. Все предложенные подходы и методы имеют надежную теоретическую основу и сопровождаются экспериментами в симуляторах.

Ключевые слова:

аукционы, машинное обучение, мультиагентные системы, нейронные сети, обучение с подкреплением, персонализация, теория игр

Исследование универсальности моделей статистической механики методами машинного обученияКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Чертенков Владислав Игоревич

Руководитель:

Щур Лев Николаевич

Дисс. совет:

Совет по инженерным наукам и прикладной математике

Диссертационная работа посвящена разработке метода исследования фазовых переходов в решеточных спиновых моделях с помощью анализа функции вариации выхода нейронной сети. Разработанный метод позволяет систематически извлекать критический показатель корреляционной длины и температуру фазового перехода для моделей Изинга, Бакстера-Ву и четырехкомпонентного Поттса с высокой точностью. Полученные результаты в пределах статистических ошибок согласуются с данными численного моделирования методами Монте-Карло и точными аналитическими решениями. Исследуются факторы, влияющие на точность работы метода, даны рекомендации при выборе параметров моделирования. Разработан метод кодирования входных конфигураций спинов, позволяющий переносить знание о фазовом переходе между классами универсальности для исследования решеточных спиновых моделей.

Ключевые слова:

transfer learning, классы универсальности, машинное обучение, метод Монте-Карло, модель Бакстера-Ву, модель Изинга, модель Поттса, нейронные сети

Диссертация [*.pdf, 14.84 Мб] (дата размещения 7/17/2024)

Резюме [*.pdf, 560.14 Кб] (дата размещения 7/17/2024)

Summary [*.pdf, 512.63 Кб] (дата размещения 7/17/2024)

Глубокие порождающие модели для поиска аномалийКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Рыжиков Артём Сергеевич

Руководитель:

Деркач Денис Александрович

Дисс. совет:

Совет по компьютерным наукам

В данной работе исследуется использование глубоких генерирующих моделей, в частности, для повышения надежности и эффективности методов обнаружения аномалий и редких классов. Такого рода задачи часто встречаются в реальных сценариях, когда выборок определенных классов мало или нет вовсе, что приводит к значительному дисбалансу классов и неполному использованию данных об аномальных и редких классах или переобучению. В исследовании представлен ряд принципиально новых подходов, основанных на глубинных MCMC процессах, нормализующих потоках и латентных стохастических дифференциальных уравнениях, направленных на преодоление разрыва между задачами обнаружения аномалий с учителем и без учителя. Эти методы изучаются и подтверждаются с помощью множественных экспериментов на табличных, графических и временных данных, в которых представленные методы значительно превосходят ранее существующие подходы обнаружения аномалий.В частности, практическая значимость изучаемых методов отдельно изучается на реальной задаче обнаружения аномалий в физике высоких энергий, где также демонстрируются большой потенциал глубоких генерирующих моделей обучения.

Ключевые слова:

анализ временных рядов, генеративное обучение, глубинное обучение, машинное обучение, нейронные сети, обнаружение аномалий

Диссертация [*.pdf, 24.60 Мб] (дата размещения 8/16/2024)

Резюме [*.pdf, 167.44 Кб] (дата размещения 8/16/2024)

Summary [*.pdf, 128.66 Кб] (дата размещения 8/16/2024)

Новые представления для изображений и 3D сценКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Хахулин Тарас Андреевич

Руководитель:

Лемпицкий Виктор Сергеевич

Дисс. совет:

Совет по компьютерным наукам

В данной работе исследуются различные методы для получения новых возможностей при генерации изображений и 3D-сцен. В первой части разбирается проблема преобразования изображений высокого разрешения из непарных данных и создания генеративных моделей без сверточных нейронных сетей. Далее демонстрируется новое представление произвольных трехмерных сцен, что позволяет осуществлять реконструкцию на основе разреженных входных данных. В последней части рассматривается задача генерации анимируемых изображений людей выучивая зависимости из видео. В работе предлагаются новые методы нейронного рендеринга на основе построения аппроксимированной геометрии головы по входному изображению и альтернативный метод без использования явной 3D геометрии. Также выявляется способ улучшить выходное разрешение без прямого использования высококачественных данных.

Ключевые слова:

анимация изображений, генерация изображений, компьютерное зрение, нейронные сети, реконструкция сцен

Диссертация [*.pdf, 44.11 Мб] (дата размещения 8/27/2024)

Резюме [*.pdf, 123.91 Кб] (дата размещения 8/27/2024)

Summary [*.pdf, 104.79 Кб] (дата размещения 8/27/2024)

Методы повышения обобщающей способности моделей в задачах 3D компьютерного зренияКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Рахимов Руслан Ильдарович

Руководитель:

Бурнаев Евгений Владимирович

Дисс. совет:

Совет по компьютерным наукам

Дата защиты:

9/30/2024

Диссертация посвящена улучшению обобщающей способности моделей 3D компьютерного зрения, что важно для их надежного функционирования в разнообразных, ранее не исследованных условиях. Исследование фокусируется на создании инновационных моделей для генерации синтетических данных, 3D реконструкции, генерации новых видов и плотной оценки позы человека. В частности, рассматривается возможность моделирования последовательности кадров в дискретном скрытом пространстве. Далее предложен метод для локализации особых кривых в 3D моделях, позволяющий обрабатывать зашумленные, высокоразрешенные 3D данные. Также рассмотрена модель для быстрой генерации новых видов, не требующая дополнительной оптимизации на новых сценах. Предложены улучшения для модели плотной оценки позы человека, позволяющие запускать её на мобильных устройствах. Наконец, показывается, как адаптировать модель 3D реконструкции головы человека на основе одного изображения для использования с неизвестными параметрами камеры.

Ключевые слова:

генеративное моделирование, генерация новых видов, глубокое обучение, нейронные сети, оценка позы человека, трехмерная реконструкция, трехмерное компьютерное зрение

Диссертация [*.pdf, 12.71 Мб] (дата размещения 7/29/2024)

Резюме [*.pdf, 32.87 Мб] (дата размещения 7/29/2024)

Summary [*.pdf, 32.83 Мб] (дата размещения 7/29/2024)

Обобщение нейронных сетей на алгебру дуальных чиселКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Павлов Станислав Владимирович

Руководитель:

Калягин Валерий Александрович

Дисс. совет:

Совет по компьютерным наукам

Дата защиты:

7/23/2024

Большинство нейронных сетей работают с алгеброй вещественных чисел, однако по мере развития теоретического понимания основ нейронных сетей и их практического применения возникают новые проблемы, требующие выхода за эти рамки. В частности, возникают различные задачи, когда исходные данные, естественно имеют комплексные форматы. Это побуждает исследовать, могут ли нейронные сети, основанные на комплексных числах, обеспечить преимущества перед теми, которые ограничены реальными числами, а также разработку архитектуры и строительных блоков комплексных нейронных сетей. В работе предлагается следующий шаг по обобщению подхода комплексных нейронных сетей на алгебру дуальных чисел. Осуществляется поиск путей реализации и приводятся результаты массовых экспериментов.
Используются идеи дуальных чисел. Разрабатывается математическое обеспечение различных операций. Предлагаются обобщённые операторы и методология переноса знаний. Строятся дуальные сети. В результатепоказывается, что подобное обобщение улучшает производительность и точность.

Ключевые слова:

гиперкомплексная норма, гиперкомплексная пакетная нормализация, гиперкомплесные нейронные сети, глубокое обучение, дуальные нейронные сети, дуальные числа

Диссертация [*.pdf, 2.47 Мб] (дата размещения 5/22/2024)

Резюме [*.pdf, 1.40 Мб] (дата размещения 5/22/2024)

Summary [*.pdf, 1.27 Мб] (дата размещения 5/22/2024)

Динамика обучения и ландшафт функции потерь нейронных сетей с масштабно-инвариантными параметрамиКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Кодрян Максим Станиславович

Руководитель:

Ветров Дмитрий Петрович

Дисс. совет:

Совет по компьютерным наукам

Дата защиты:

1/23/2024

Большинство современных нейронных сетей используют в своей архитектуре те или иные техники нормализации, к примеру, пакетную нормализацию (batch normalization), что эмпирически позволяет стабилизировать обучение и добиться лучшего качества. Главным следствием нормализации является масштабная инвариантность параметров, предшествующих слоям нормализации. В данной работе приводится подробное экспериментальное и теоретическое исследование влияния свойства масштабной инвариантности на динамику обучения и ландшафт функции потерь нормализованных нейросетевых моделей. В первой части работы раскрывается эффект периодического поведения динамики обучения с использованием нормализации и сокращения веса. Во второй части работы анализируются три режима обучения масштабно-инвариантных нейронных сетей на сфере, что позволяет выделить ряд особенностей внутреннего устройства ландшафта функции потерь.

Ключевые слова:

ландшафт функции потерь, масштабная инвариантность, нейронные сети, сокращение веса, техники нормализации

Диссертация [*.pdf, 60.61 Мб] (дата размещения 9/15/2023)

Резюме [*.pdf, 5.69 Мб] (дата размещения 9/15/2023)

Summary [*.pdf, 5.56 Мб] (дата размещения 9/15/2023)

Модели и методы автоматической обработки неструктурированных данных в биомедицинской областиДокторская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Тутубалина Елена Викторовна

Дисс. совет:

Совет по компьютерным наукам

Дата защиты:

11/7/2023

Диссертационная работа представляет собой комплексное исследование, направленное на улучшение эффективности моделей и методов автоматической обработки текстов в биомедицинской области на основе современных языковых моделей архитектуры Трансформер. Разработаны новые модели и методы классификации и извлечения информации, в том числе модель связывания именованных сущностей, оптимизирующая сходство представлений сущностей и концептов, многоязычные модели для распознавания именованных сущностей, мультимодальные методы для обнаружения побочных реакций на лекарственные препараты. Впервые предложены и созданы аннотированные корпуса текстов на английском и русском языках из различных биомедицинских источников: научные абстракты (корпус NEREL-BIO), пользовательские отзывы о лекарствах (RuDReC), электронные медицинские карты (RuCCoN) и клинические испытания. Предложены новые подходы к оценке моделей связывания именованных сущностей. Эффективность предложенных моделей и методов подтверждена в рамках большого числа вычислительных экспериментов и открытых тестирований CLEF eHealth 2017 Task 1, #SMM4H Shared Tasks 2019-2021 годов. Предложенные корпуса, кодовая база и другие материалы находятся в открытом доступе.

Ключевые слова:

автоматическая обработка текстов, биомедицинская область, извлечение информации, компьютерная лингвистика, машинное обучение, нейронные сети

Диссертация [*.pdf, 10.78 Мб] (дата размещения 7/27/2023)

Резюме [*.pdf, 1.89 Мб] (дата размещения 7/27/2023)

Summary [*.pdf, 1.81 Мб] (дата размещения 7/27/2023)

Методы и проблемы децентрализованного глубинного обученияКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Рябинин Максим Константинович

Руководитель:

Бабенко Артем Валерьевич

Дисс. совет:

Совет по компьютерным наукам

Дата защиты:

7/3/2023

Обучение больших нейронных сетей, достигающих в настоящее время наилучших результатов на большинстве прикладных задач, требует существенных вычислительных ресурсов. Доступ к суперкомпьютерам, обладающим достаточной мощностью, имеется только у ограниченного круга исследователей, что ограничивает возможности для развития машинного обучения как научной области. В данной работе предлагается способ для решения проблемы нехватки вычислительных ресурсов посредством добровольных вычислений, то есть использования свободных ресурсов волонтеров, подключенных к одной распределенной сети. Для решения проблем, возникающих при использовании распределенного машинного обучения в этой постановке, предлагается ряд методов, учитывающих такие её особенности, как ненадежность отдельных узлов, гетерогенность аппаратного обеспечения и сравнительно низкая скорость сетевых соединений. В частности, в работе предложена специализированная нейросетевая архитектура, устойчивая к сетевым задержкам и нестабильности узлов, разработан эффективный способ агрегации параметров моделей в неустойчивой сети, а также представлен метод для совместного предварительного обучения с учетом возможностей каждого участвующего устройства. Предложенные методы позволяют эффективно использовать мощности устройств волонтеров или вытесняемых облачных узлов при распределенном обучении нейронных сетей для широкого ряда сценариев.

Ключевые слова:

децентрализованное обучение, модели глубинного обучения, нейронные сети, распределенные системы

Диссертация [*.pdf, 3.47 Мб] (дата размещения 5/2/2023)

Резюме [*.pdf, 739.28 Кб] (дата размещения 5/2/2023)

Summary [*.pdf, 699.77 Кб] (дата размещения 5/2/2023)

Разработка методов машинного обучения с подкреплением для управления робототехническими устройствами и виртуальными агентамиКандидатская диссертацияУченая степень НИУ ВШЭ

Соискатель:

Сорокин Дмитрий Игоревич

Руководитель:

Львовский Александр Исаевич

Дисс. совет:

Совет по компьютерным наукам

Дата защиты:

6/1/2023

В рамках данной диссертации сделан фокус на разработку методов, основанных на обучении с подкреплением, применимых для управления робототехническими устройствами. Современные методы глубокого обучения с подкреплением способны решать задачи управления в виртуальных средах без использования априорной информации о решаемой задаче. Обучение происходит путем проб и ошибок, в котором агент взаимодействует со средой и учится оптимизировать свои действия так, чтобы они приводили к большей ожидаемой награде. При применении таких методов для управления физическими устройствами возникает ряд сложностей, связанных с переносом из симуляции на физическую установку, использованием действий различного масштаба, сходимостью к суб-оптимальной стратегии и трудности с объединением нейросетевых и алгоритмических подходов. В работе предложен набор алгоритмов, которые позволяют выучить эффективную стратегию с учетом этих ограничений. Качество работы предложенных алгоритмов рассматривается на практически важных задачах, таких как настройка оптического интерферометра, управление движением шагающего робота и виртуальная среда NetHack.

Ключевые слова:

нейронные сети, обучение с подкреплением, роботика

Диссертация [*.pdf, 7.62 Мб] (дата размещения 3/17/2023)

Резюме [*.pdf, 1.96 Мб] (дата размещения 3/17/2023)

Summary [*.pdf, 1.95 Мб] (дата размещения 3/17/2023)

12 →

Название:
Автор:
Научный руководитель:
Ключевые слова:
Год защиты:
Тип диссертации:
Тип ученой степени:
Диссертационный совет:
Специальность:
Показать работы только с полным текстом диссертации