Трёхмерное компьютерное зрение

2025/2026

Лучший по критерию «Новизна полученных знаний»

Статус: Маго-лего

Кто читает: Департамент больших данных и информационного поиска

Где читается: Факультет компьютерных наук

Когда читается: 3 модуль

Охват аудитории: для всех кампусов НИУ ВШЭ

Преподаватели: Алиев Мишан Хаммад оглы, Струминский Кирилл Алексеевич

Язык: русский

Кредиты: 4

Контактные часы: 40

Дополнительные материалы в LMS Задать вопрос

Аннотация

Компьютерное зрение позволяет алгоритмам распознавать объекты на изображениях, но как они могут понять глубину, форму и структуру окружающего пространства? Трёхмерное компьютерное зрение отвечает на эти вопросы, открывая двери к созданию умных роботов, дополненной реальности, автономным автомобилям и цифровым двойникам реального мира. В этом курсе мы разберём: - Как формируются изображения — от камеры до нейросетей. - Методы оценки глубины — как алгоритмы определяют расстояние до объектов. - Работу с облаками точек — обработка и анализ 3D-данных. - Современные методы реконструкции 3D-сцен — от классических подходов до нейросетевых технологий. - Генеративные модели для 3D — методы и подходы к генерации.

Цель освоения дисциплины

Ознакомить студентов с математическими основами формирования изображений и многовидовой геометрии.
Сформировать понимание современных нейросетевых методов для задач 3D-зрения.
Развить практические навыки реализации алгоритмов обработки и реконструкции 3D-данных.
Познакомить студентов с генеративными моделями для 3D-данных и их приложениями.

Планируемые результаты обучения

Знать математические основы модели пинхол камеры, элементы проективной геометрии и эпиполярной геометрии.
Знать принципы работы диффузионных моделей и их применение к генерации 3D-данных.
Знать принципы объёмного рендеринга, методы Gaussian Splatting и NeRF для представления сцен.
Знать основные архитектуры глубокого обучения для обработки облаков точек и полигональных сеток.
Уметь применять параметрические модели человеческого тела (SMPL) для оценки позы и формы.
Владеть навыками работы с системами дифференцируемого рендеринга для решения задач трёхмерной реконструкции.
Уметь применять методы оценки глубины и структуры сцены по одному и нескольким изображениям.
Уметь реализовывать алгоритмы компьютерного зрения на языке Python с использованием современных библиотек.