Адверсариальные атаки на мультимодальные языковые модели

ФИО студента: KNUNYANTS IVAN VLADIMIROVICH

Руководитель: Артемова Екатерина Леонидовна

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2021

В последнее время всё большую популярность получают мультимодальные задачи. Они заключаются в том, что модель на вход принимает два разных типа входных данных. Такими задачами являются, например, задачи Image captioning и VQA. До недавнего времени, с такими задачами справлялись модели вида CNN+RNN. Тем не менее, лучшие результаты показали мультимодальные системы, использующие архитектуру трансформера. Не смотря на их популярность, до сих пор не было проведено значимых исследований по адверсариальным атакам на эти модели. Именно эти атаки отражают уязвимость моделей к незначительным преобразованиям входных данных. Целью данного исследования является применение адверсариальных атак к мультимодальным моделям-транформерам. В качестве модели для атаки выбрана LXMERT, которая решает задачу VQA. Результаты работы показывают, что даже у простого вида адверсариальной атаки получилось успешно запутать модель.В последнее время всё большую популярность получают мультимодальные задачи. Они заключаются в том, что модель на вход принимает два разных типа входных данных. Такими задачами являются, например, задачи Image captioning и VQA. До недавнего времени, с такими задачами справлялись модели вида CNN+RNN. Тем не менее, лучшие результаты показали мультимодальные системы, использующие архитектуру трансформера. Не смотря на их популярность, до сих пор не было проведено значимых исследований по адверсариальным атакам на эти модели. Именно эти атаки отражают уязвимость моделей к незначительным преобразованиям входных данных. Целью данного исследования является применение адверсариальных атак к мультимодальным моделям-транформерам. В качестве модели для атаки выбрана LXMERT, которая решает задачу VQA. Результаты работы показывают, что даже у простого вида адверсариальной атаки получилось успешно запутать модель.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ