2023/2024
Компьютерное зрение
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Маго-лего
Когда читается:
3 модуль
Онлайн-часы:
10
Охват аудитории:
для своего кампуса
Преподаватели:
Кантонистова Елена Олеговна
Язык:
русский
Кредиты:
3
Контактные часы:
14
Программа дисциплины
Аннотация
Курс охватывает основные задачи компьютерного зрения. В рамках курса слушатели научатся программно обрабатывать изображения, поймут на чем основаны все фоторедакторы. Затем они познакомятся с глубинным обучением для основных задач с учителем, возникающих в зрении, а именно классификации, сегментации и детекции. В дополнении к задаче с учителем, слушатели познакомятся с генеративными моделями. Кроме того, в рамках курса слушатели узнают о поведении нейронных сетей для задачи зрения и признаках что они порождают. Научатся с ними работать.
Затем в курсе будет показана работа с 3D объектами. Будет рассказано об математической модели камеры и способах восстановить глубину и сцену по изображениям. Так же будет рассказаны основы графики и инструменты машинного обучения и анализа 3D объектов в сцене.
Цель освоения дисциплины
- Ознакомление студентов с основными подходами и алгоритмами компьютерного зрения в 2D. Планируется дать понимание того, какие существуют подходы к решению задач распознавания, детектирования, трекинга объектов, научить выбирать алгоритм, наиболее подходящий для рассматриваемой студентом задачи, научить обучать модели с использованием современных нейросетевых библиотек.
Планируемые результаты обучения
- Владеют основными понятиями и задачами CV
- Имеют представление о классических методах обработки изображений и возможностях их использования с помощью языка Python
- Понимают, как обучить качественный классификатор, как можно влиять на процесс обучения и получить прирост в точности.
- Студенты понимают принцип работы и обучения одностадийных детекторов и могут использовать их самостоятельно при построении решений.
- Студенты имеют имеют представление о самых распространенных методах трекинга объектов на видеопотоке, могут выбрать метод соответственно поставленной задаче и реализовать его.
- Студенты осведомлены о постановке и особенностях задачи распознавания лиц, представляют, из чего состоит пайплайн работы подобных систем, могут самостоятельно обучить модель для подобной задачи.
- Студенты знакомы с самыми популярными методами OCR, имеют представление о принципах их работы, а также возможности их использования на языке Python.
- Получено представление о принципах работы мультимодальных сетей, получено понимание применимости их к различным задачам.
Содержание учебной дисциплины
- Введение в компьютерное зрение, классические методы
- Задача классификации: лучшие практики
- Задача детектирования
- Трекинг объектов
- Распознавание лиц
- OCR (Optical Character Recognition)
- Мультимодальные сети
Элементы контроля
- HW1 - Соревнование по классификации
- HW2 - Сегментация
- HW3 - Детекция + трекинг
- HW4 - Face Recognition (бонусное)
Промежуточная аттестация
- 2023/2024 учебный год 3 модульmin(10, round(HW/MAX)) где HW – сумма полученных баллов за все домашние задания (в том числе бонусные), а MAX = 30 — максимум баллов по трем обязательным домашним заданиям. Мягкий дедлайн объявляется в день выдачи домашнего задания и составляет 2 недели.