• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2025/2026

Проектирование хранилищ данных

Статус: Курс по выбору (Машинное обучение и анализ данных)
Когда читается: 2-й курс, 3 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 32

Программа дисциплины

Аннотация

Данная дисциплина посвящена всеобъемлющему обзору принципов, методов и технологий, используемых для проектирования и построения современных корпоративных хранилищ данных (DWH). Дисциплина начинается с введения в роль данных в архитектуре предприятия и эволюции архитектурных паттернов: от классических хранилищ (DWH) к Data Lake и современным гибридным подходам (Data Lakehouse). Студенты изучат ключевые методологии моделирования данных (Inmon, Kimball, Data Vault) и их применение в различных бизнес-контекстах, включая регулируемые отрасли, такие как банковская. Особое внимание уделяется технологическому стеку: реляционные и нереляционные СУБД, системы больших данных (Hadoop, Spark) и инструменты интеграции (Kafka, CDC). Курс охватывает полный жизненный цикл хранилища — от проектирования ETL/ELT-процессов и обеспечения качества данных до оркестрации, мониторинга и эксплуатации. Завершается программа обзором современных трендов, включая Data Mesh, Real-time DWH и подходы к построению AI-driven хранилищ, что позволяет слушателям сформировать целостное представление о настоящем и будущем корпоративных систем данных.