• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Разработка алгоритма преобразования стиля изображений с применением алгоритмов машинного обучения и параллельных вычислений

ФИО студента: Цветов Павел Александрович

Руководитель: Трубочкина Надежда Константиновна

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Информатика и вычислительная техника (Бакалавриат)

Год защиты: 2020

Основной целью данной работы является повышение размерности изображений в алгоритме стилизации и создание возможностей для художников, дизайнеров, работников кинематографа, и пр. для эффективной стилизации и использования изображений с высоким разрешением в своей профессии. В этой работе было рассмотрено несколько возможных расширений и улучшений оригинального алгоритма передачи нейронного стиля Gatys et al (2016). Для генерации изображений была использована бесплатная облачная платформа Google Colaboratory, а также с целью тестирования стилизации с использованием параллельных вычислений были арендованы вычислительные ресурсы Google Cloud Platform. В рамках выполнения выпускной квалификационной работы был разработан алгоритм, способный генерировать выходные изображения с высоким разрешением с использованием CUDA, cuDNN и алгоритмов параллельных вычислений. После описания принципов работы алгоритма, и проведенного тестирования были выявлены основные ограничения и недостатки алгоритма, и предложены решения для ускорения вычислений и уменьшения времени стилизации. В рамках экспериментальной части дипломной работы был выполнен поиск оптимальных параметров для разработанного алгоритма, а также были проведены исследования алгоритмов мультистилевого переноса, быстрого переноса стиля, фотореалистичного переноса стиля, переноса стиля с сохранением цвета, контроля размера кисти, и т. д. Было предложено объяснение необходимых модификаций, которые являются достаточными для достижения этих эффектов, и предложены некоторые соображения для дальнейшего изучения. Дальнейшие исследования предполагают улучшение разработанного алгоритма, ускорение вычислений, оптимизация программного кода, а также добавление новой функциональности. Алгоритмы были реализованы на языке программирования Python 3.7 совместно с использованием фреймворка для машинного обучения PyTorch 1.4, созданного компанией Facebook, для выполнения расчетов в нейронной сети. Данная работа содержит 115 страниц, 77 рисунков, 7 таблиц, 11 формул, 7 листов приложений, а также включает в себя использованных источников. Ключевые слова: компьютерная система стилизации изображений, машинное обучение, глубокое обучение, нейронные сети, сверточные нейронные сети, генерация изображений высокого разрешения, алгоритм нейронного переноса стиля, параллельные вычисления, облачные вычисления, PyTorch

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ