• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Исследование технологий для задачи клонирования голоса и методов их улучшенияInvestigating voice cloning technologies and methods of their improvement

Члены комитета:
Кузнецов Сергей Олегович (НИУ ВШЭ, д.ф.-м.н., председатель комитета), Андреев Павел Константинович (HeyGen Canada Incorporated, к.комп.н., член комитета), Карпов Алексей Анатольевич (РАН, д.т.н., член комитета), Рюмин Дмитрий Александрович (РАН, к.т.н., член комитета), Шуранов Евгений Витальевич (ООО «Техкомпания Хуавей», к.т.н., член комитета)
Диссертация принята к предварительному рассмотрению:
10/31/2025
Диссертация принята к защите:
12/25/2025
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
3/4/2026
В рамках диссертации были исследованы различные архитектуры синтеза речи применительно к задаче клонирования голоса и предложена новая диффузионная модель. Рассматривались два сценария: кодирование по одному короткому аудио и адаптация части модели - и оптимальные способы их реализации. В качестве улучшений проверялась идея объединения диффузионных и генеративно-состязательных моделей с целью ускорения генерации речи, а также предложен метод модификации векторов голоса для синтеза эмоциональных записей.
Диссертация [*.pdf, 8.47 Мб] (дата размещения 12/30/2025)
Резюме [*.pdf, 1.05 Мб] (дата размещения 12/30/2025)
Summary [*.pdf, 1.00 Мб] (дата размещения 12/30/2025)