Устойчивость моделей глубокого обученияRobustness of Deep Learning Models

Соискатель:

Корж Дмитрий Сергеевич

Руководитель:

Оселедец Иван Валерьевич (др. работы под рук-вом)

Члены комитета:

Деркач Денис Александрович (НИУ ВШЭ, PhD, председатель комитета), Галактионов Владимир Александрович (РАН, д.ф.-м.н., член комитета), Наумов Алексей Александрович (РАН, д.комп.н., член комитета), Николенко Сергей Игоревич (РАН, д.ф.-м.н., член комитета), Тюкин Иван Юрьевич (АНО ВО «Сколковский институт науки и технологий», д.т.н., член комитета)

Диссертация принята к предварительному рассмотрению:

12/25/2025

Диссертация принята к защите:

1/29/2026

Дисс. совет:

Совет по компьютерным наукам

Дата защиты:

4/15/2026

В последнее время модели глубокого обучения получили повсеместное применение. Однако уязвимость к малозаметным состязательным атакам, чувствительность к естественным шумам и семантическим возмущениям и рост рисков подделки голоса являются актуальной проблемой, особенно для высокорисковых приложений, как медицина или биометрия. Целью исследования является разработка новых сертифицируемых (доказуемых) и эмпирических методов, обеспечивающих устойчивость, доверенность и приватность моделей без существенных ограничений для их применения. Методологическая основа включает в себя развитие сертификации классификаторов изображений к композициям семантических возмущений и прототипических векторных моделей к аддитивным возмущениям на основе случайного сглаживания и статистических методов, а также проектирование универсальных состязательных возмущений для приватности (анонимизации) диктора и развитие моделей голосового антиспуфинга. По результатам работы предложен новый вычислительно-аналитический метод сертификации устойчивости классификаторов изображений к широкому классу композиционных преобразований на основе анализа липшицевости модели относительно параметров возмущения. Получены улучшенные гарантии сертификации прототипических моделей, в том числе впервые для задачи идентификации диктора. Также представлен способ анонимизации речи с использованием экспоненциальной функции потерь полной вариации. Более того, предложены новые архитектуры детекции синтетической речи на основе сетей Колмогорова-Арнольда. Научная новизна работы заключается в улучшении и расширении возможностей сертификации классификаторов изображений для новых композиционных возмущений, улучшении сертификации прототипических моделей, создании метода приватности диктора с улучшенным балансом анонимизации, качества аудио и распознавания речи, а также в разработке более устойчивой архитектуры детекции синтетической речи. Практическая значимость состоит в применении предложенных решений для анализа устойчивости моделей перед внедрением, обеспечении их более устойчивой и доверенной работы, а также защиты приватности личности в задачах голосовой биометрии и антиспуфинга.

Диссертация [*.pdf, 6.93 Мб] (дата размещения 2/3/2026)

Резюме [*.pdf, 634.41 Кб] (дата размещения 2/3/2026)

Summary [*.pdf, 607.42 Кб] (дата размещения 2/3/2026)

Публикации, в которых излагаются основные результаты диссертации

General Lipschitz: Certified Robustness Against Resolvable Semantic Transformations via Transformation-Dependent Randomized Smoothing (смотреть на сайте журнала)

Certification of Speaker Recognition Models to Additive Perturbations (смотреть на сайте журнала)

Novel Loss-Enhanced Universal Adversarial Patches for Sustainable Speaker Privacy (смотреть на сайте журнала)

AASIST3: KAN-Enhanced AASIST Speech Deepfake Detection using SSL Features and Additional Regularization for the ASVspoof 2024 Challenge (смотреть на сайте журнала)

Clarispeech: LLM-Enhanced Speech Recognition Post-Correction (смотреть на сайте журнала)

Отзывы

Отзыв научного руководителя

Отзыв научного руководителя (дата размещения 2/2/2026)

Отзыв члена Комитета

Тюкин Иван Юрьевич (дата размещения 4/8/2026)
Николенко Сергей Игоревич (дата размещения 4/6/2026)
Галактионов Владимир Александрович (дата размещения 4/8/2026)
Деркач Денис Александрович (дата размещения 4/8/2026)
Наумов Алексей Александрович (дата размещения 4/8/2026)

Ключевые слова:

Adversarial attacks, certified robustness, image classifiers, neural networks, speaker privacy methods, voice anti-spoofing, voice biometrics