• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2023/2024

Компьютерное зрение

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Маго-лего
Когда читается: 3 модуль
Онлайн-часы: 10
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 14

Программа дисциплины

Аннотация

Курс охватывает основные задачи компьютерного зрения. В рамках курса слушатели научатся программно обрабатывать изображения, поймут на чем основаны все фоторедакторы. Затем они познакомятся с глубинным обучением для основных задач с учителем, возникающих в зрении, а именно классификации, сегментации и детекции. В дополнении к задаче с учителем, слушатели познакомятся с генеративными моделями. Кроме того, в рамках курса слушатели узнают о поведении нейронных сетей для задачи зрения и признаках что они порождают. Научатся с ними работать. Затем в курсе будет показана работа с 3D объектами. Будет рассказано об математической модели камеры и способах восстановить глубину и сцену по изображениям. Так же будет рассказаны основы графики и инструменты машинного обучения и анализа 3D объектов в сцене.
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление студентов с основными подходами и алгоритмами компьютерного зрения в 2D. Планируется дать понимание того, какие существуют подходы к решению задач распознавания, детектирования, трекинга объектов, научить выбирать алгоритм, наиболее подходящий для рассматриваемой студентом задачи, научить обучать модели с использованием современных нейросетевых библиотек.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеют основными понятиями и задачами CV
  • Имеют представление о классических методах обработки изображений и возможностях их использования с помощью языка Python
  • Понимают, как обучить качественный классификатор, как можно влиять на процесс обучения и получить прирост в точности.
  • Студенты понимают принцип работы и обучения одностадийных детекторов и могут использовать их самостоятельно при построении решений.
  • Студенты имеют имеют представление о самых распространенных методах трекинга объектов на видеопотоке, могут выбрать метод соответственно поставленной задаче и реализовать его.
  • Студенты осведомлены о постановке и особенностях задачи распознавания лиц, представляют, из чего состоит пайплайн работы подобных систем, могут самостоятельно обучить модель для подобной задачи.
  • Студенты знакомы с самыми популярными методами OCR, имеют представление о принципах их работы, а также возможности их использования на языке Python.
  • Получено представление о принципах работы мультимодальных сетей, получено понимание применимости их к различным задачам.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в компьютерное зрение, классические методы
  • Задача классификации: лучшие практики
  • Задача детектирования
  • Трекинг объектов
  • Распознавание лиц
  • OCR (Optical Character Recognition)
  • Мультимодальные сети
Элементы контроля

Элементы контроля

  • неблокирующий HW1 - Соревнование по классификации
  • неблокирующий HW2 - Сегментация
  • неблокирующий HW3 - Детекция + трекинг
  • неблокирующий HW4 - Face Recognition (бонусное)
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 3 модуль
    min(10, round(HW/MAX)) где HW – сумма полученных баллов за все домашние задания (в том числе бонусные), а MAX = 30 — максимум баллов по трем обязательным домашним заданиям. Мягкий дедлайн объявляется в день выдачи домашнего задания и составляет 2 недели.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Компьютерное зрение : учеб. пособие для студентов вузов, Шапиро, Л., 2006

Рекомендуемая дополнительная литература

  • Computer vision for visual effects, Radke, R. J., 2013