• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Модель глубокого обучения чтения по губам

ФИО студента: Петров Андрей Иванович

Руководитель: Макаров Илья Андреевич

Кампус/факультет: Факультет компьютерных наук

Программа: Науки о данных (Магистратура)

Год защиты: 2021

Чтение по губам, также известное как визуальное распознавание речи, - это операция распознавания речи из видео путем анализа движения губ. Из-за схожести движения губ для различных слов, данная задача является достаточно трудной, однако в последние годы было достигнуто несколько привлекательных успехов, в значительной степени благодаря методам глубокого обучения и недавним крупномасштабным наборам данных для чтения по губам. Большинство существующих методов получили высокую производительность при построении сложной нейронной сети вместе с несколькими индивидуальными стратегиями обучения. Тем не менее подавляющее большинство исследований были направлены на распознавания отдельных изолированных наборов слов. В этой работе представлена гибридная модель, основанную на ResNet-18 и рекуррентной LSTM с использованием нового подхода к разбиению данных, а именно временной составляющей видеопоследовательности. Сеть была обучена на крупномасштабном наборе данных для распознавания речи на уровне предложений, Lip Reading Sentences 2 (LRS2). Ключевые слова: визуальное распознавание речи, чтение по губам, глубинное обучение

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ