• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Использование нейросетевых кодов и выделения регионов для поиска изображений

ФИО студента: Фенстер Александра Михайловна

Руководитель: Воронцов Константин Вячеславович

Кампус/факультет: Факультет компьютерных наук

Программа: Науки о данных (Магистратура)

Год защиты: 2015

В данной работе описывается и исследуется новый алгоритм поиска по изображениям, основанный на использовании дескрипторов, извлечённых с последних слоёв глубокой свёрточной нейросети, обученной для задачи классификации. Предложена схема извлечения множества нейросетевых дескрипторов для одного изображения и агрегации результатов поиска по этим нейродескрипторам через схемы простого и взешенного голосования. Множественность дескрипторов для одного изображения обеспечивает использование более полной визуальной информации, содержащейся в исходном изображении-запросе при информационном поиске, чем использование одного дескриптора для сжатого изображения. Её удаётся обеспечить за счёт различных стратегий выделения регионов изображения, содержащих области интересов: Selective Search и Grid. Обе стратегии подробно представлены в работе. Тестирование качества поиска проводилось на тестовой коллекции The INRIA Holidays. В ходе проведения экспериментальной части был освоен фрэймворк Caffe, используемый для задач глубокого обучения. В частности, с помощью обученной для задачи классификации модели BVLC Reference CaffeNet, для регионов изображений тестовой коллекции Holidays были извлечены нейродескрипторы различных типов. Весь алгоритм поиска был полностью реализован в python-прототипе с использованием собственной CUDA-реализации поиска ближайшего соседа: от обработки изображений коллекции до этапа измерения качества поиска по изображениям-запросам коллекции. Сравнение различных вариантов алгоритма позволило не только установить существенное повышение качества относительно использования традиционных методов поиска, но и описать несколько оптимальных вариантов алгоритма, пригодных для использования в практических приложениях, предъявляющих высокие требования к качеству поиска. Ключевые слова: информационный поиск, поиск по изображениям, глубокие свёрточные нейронные сети, нейросетевые коды, нейродескрипторы, caffe, Holidays.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ