• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Управление данными в цифровых экосистемах

2025/2026
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс по выбору
Когда читается:
2-й курс, 2 модуль

Преподаватель

Программа дисциплины

Аннотация

Дисциплина направлена на освоение принципов управления данными (Data Governance) в крупных компаниях и цифровых экосистемах. В рамках дисциплины студенты также познакомятся с особенностями работы с базами данных, принципами организации реляционных баз данных и хранилищ данных, получат практические навыки в принятии архитектурных решений в аналитических проектах.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины "Управление данными в цифровых экосистемах" является получение студентами знаний и навыков владения современными методами и средствами, предназначенными для обработки и хранения больших данных и построения аналитики по ним.
Планируемые результаты обучения

Планируемые результаты обучения

  • Формулирует, как организованы процессы управления данными в организациях и цифровых экосистемах.
  • Обосновывает архитектуру данных для крупных организаций и цифровых экосистем в зависимости от бизнес-задач и ресурсов.
  • Объясняет принципы организации реляционных баз данных и хранилищ данных, NoSQL-баз данных и их отличия от реляционных баз данных.
  • Аргументирует функцию и роль Big Data-инструментов в задачах аналитики.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Data Governance: основы управления данными в компаниях и цифровых экосистемах.
  • Data архитектура
  • Основные концепции организации реляционных баз данных и хранилища данных (DWH).
  • Инструменты работы с Big Data.
Элементы контроля

Элементы контроля

  • неблокирующий Решение бизнес-кейсов
  • неблокирующий Аудиторная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.25 * Аудиторная работа + 0.75 * Решение бизнес-кейсов
Список литературы

Список литературы

Рекомендуемая основная литература

  • Высоконагруженные приложения. Программирование, масштабирование, поддержка - 978-601-08-3514-6 - Клеппман Мартин - 2024 - Астана: Спринт Бук - https://ibooks.ru/bookshelf/397501 - 397501 - iBOOKS
  • Распределенные данные. Алгоритмы работы современных систем хранения информации - 978-601-08-4866-5 - Петров Алекс - 2025 - Астана: Спринт Бук - https://ibooks.ru/bookshelf/399828 - 399828 - iBOOKS

Рекомендуемая дополнительная литература

  • Dean, J., & Ghemawat, S. (2008). Mapreduce: Simplified Data Processing on Large Clusters. Communications of the ACM, 51(1), 107–113. https://doi.org/10.1145/1327452.1327492
  • John Ladley. (2020). Data Governance : How to Design, Deploy, and Sustain an Effective Data Governance Program: Vol. Second edition. Academic Press.
  • Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit : The Definitive Guide to Dimensional Modeling (Vol. 3rd edition). Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=605991
  • Luu H. Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark SQL, Structured Streaming and Spark Machine Learning Library. – Berkeley: Apress, 2018.
  • Rohan Light, Beenish Saeed, Nathalie de Marcellis-Warin, Abdelaziz Khadraoui, Alison Holt, Benoit Aubert, David Sutton, Frédéric Gelissen, Alisdair McKenzie, Geoff Clarke, Rose Pan, & Ming Li. (2021). Data Governance : Governing Data for Sustainable Business. BCS, The Chartered Institute for IT.
  • White, T. (2015). Hadoop: The Definitive Guide : Storage and Analysis at Internet Scale: Vol. 4th edition. O’Reilly Media.

Авторы

  • Грызунова Елена Аркадьевна
  • Хапаева Наталья Михайловна
  • Добромыслова Ксения Олеговна