• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Устойчивость моделей глубокого обученияRobustness of Deep Learning Models

Соискатель:
Корж Дмитрий Сергеевич
Руководитель:
Оселедец Иван Валерьевич (др. работы под рук-вом)
Члены комитета:
Деркач Денис Александрович (НИУ ВШЭ, PhD, председатель комитета), Галактионов Владимир Александрович (РАН, д.ф.-м.н., член комитета), Наумов Алексей Александрович (РАН, д.комп.н., член комитета), Николенко Сергей Игоревич (РАН, д.ф.-м.н., член комитета), Тюкин Иван Юрьевич (АНО ВО «Сколковский институт науки и технологий», д.т.н., член комитета)
Диссертация принята к предварительному рассмотрению:
12/25/2025
Диссертация принята к защите:
1/29/2026
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
4/15/2026
В последнее время модели глубокого обучения получили повсеместное применение. Однако уязвимость к малозаметным состязательным атакам, чувствительность к естественным шумам и семантическим возмущениям и рост рисков подделки голоса являются актуальной проблемой, особенно для высокорисковых приложений, как медицина или биометрия. Целью исследования является разработка новых сертифицируемых (доказуемых) и эмпирических методов, обеспечивающих устойчивость, доверенность и приватность моделей без существенных ограничений для их применения. Методологическая основа включает в себя развитие сертификации классификаторов изображений к композициям семантических возмущений и прототипических векторных моделей к аддитивным возмущениям на основе случайного сглаживания и статистических методов, а также проектирование универсальных состязательных возмущений для приватности (анонимизации) диктора и развитие моделей голосового антиспуфинга. По результатам работы предложен новый вычислительно-аналитический метод сертификации устойчивости классификаторов изображений к широкому классу композиционных преобразований на основе анализа липшицевости модели относительно параметров возмущения. Получены улучшенные гарантии сертификации прототипических моделей, в том числе впервые для задачи идентификации диктора. Также представлен способ анонимизации речи с использованием экспоненциальной функции потерь полной вариации. Более того, предложены новые архитектуры детекции синтетической речи на основе сетей Колмогорова-Арнольда. Научная новизна работы заключается в улучшении и расширении возможностей сертификации классификаторов изображений для новых композиционных возмущений, улучшении сертификации прототипических моделей, создании метода приватности диктора с улучшенным балансом анонимизации, качества аудио и распознавания речи, а также в разработке более устойчивой архитектуры детекции синтетической речи. Практическая значимость состоит в применении предложенных решений для анализа устойчивости моделей перед внедрением, обеспечении их более устойчивой и доверенной работы, а также защиты приватности личности в задачах голосовой биометрии и антиспуфинга.
Диссертация [*.pdf, 6.93 Мб] (дата размещения 2/3/2026)
Резюме [*.pdf, 634.41 Кб] (дата размещения 2/3/2026)
Summary [*.pdf, 607.42 Кб] (дата размещения 2/3/2026)

Публикации, в которых излагаются основные результаты диссертации

General Lipschitz: Certified Robustness Against Resolvable Semantic Transformations via Transformation-Dependent Randomized Smoothing (смотреть на сайте журнала)
Certification of Speaker Recognition Models to Additive Perturbations (смотреть на сайте журнала)
Novel Loss-Enhanced Universal Adversarial Patches for Sustainable Speaker Privacy (смотреть на сайте журнала)
AASIST3: KAN-Enhanced AASIST Speech Deepfake Detection using SSL Features and Additional Regularization for the ASVspoof 2024 Challenge (смотреть на сайте журнала)
Clarispeech: LLM-Enhanced Speech Recognition Post-Correction (смотреть на сайте журнала)


Отзывы
Отзыв научного руководителя
Отзыв члена Комитета