2025/2026



Управление данными в цифровых экосистемах
Статус:
Маго-лего
Кто читает:
Школа коммуникаций
Где читается:
Факультет креативных индустрий
Когда читается:
2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Хапаева Наталья Михайловна
Язык:
русский
Кредиты:
3
Контактные часы:
40
Программа дисциплины
Аннотация
Дисциплина направлена на освоение принципов управления данными (Data Governance) в крупных компаниях и цифровых экосистемах. В рамках дисциплины студенты также познакомятся с особенностями работы с базами данных, принципами организации реляционных баз данных и хранилищ данных, получат практические навыки в принятии архитектурных решений в аналитических проектах.
Цель освоения дисциплины
- Целью освоения дисциплины "Управление данными в цифровых экосистемах" является получение студентами знаний и навыков владения современными методами и средствами, предназначенными для обработки и хранения больших данных и построения аналитики по ним.
Планируемые результаты обучения
- Формулирует, как организованы процессы управления данными в организациях и цифровых экосистемах.
- Обосновывает архитектуру данных для крупных организаций и цифровых экосистем в зависимости от бизнес-задач и ресурсов.
- Объясняет принципы организации реляционных баз данных и хранилищ данных, NoSQL-баз данных и их отличия от реляционных баз данных.
- Аргументирует функцию и роль Big Data-инструментов в задачах аналитики.
Содержание учебной дисциплины
- Data Governance: основы управления данными в компаниях и цифровых экосистемах.
- Data архитектура
- Основные концепции организации реляционных баз данных и хранилища данных (DWH).
- Инструменты работы с Big Data.
Список литературы
Рекомендуемая основная литература
- Высоконагруженные приложения. Программирование, масштабирование, поддержка - 978-601-08-3514-6 - Клеппман Мартин - 2024 - Астана: Спринт Бук - https://ibooks.ru/bookshelf/397501 - 397501 - iBOOKS
- Распределенные данные. Алгоритмы работы современных систем хранения информации - 978-601-08-4866-5 - Петров Алекс - 2025 - Астана: Спринт Бук - https://ibooks.ru/bookshelf/399828 - 399828 - iBOOKS
Рекомендуемая дополнительная литература
- Dean, J., & Ghemawat, S. (2008). Mapreduce: Simplified Data Processing on Large Clusters. Communications of the ACM, 51(1), 107–113. https://doi.org/10.1145/1327452.1327492
- John Ladley. (2020). Data Governance : How to Design, Deploy, and Sustain an Effective Data Governance Program: Vol. Second edition. Academic Press.
- Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit : The Definitive Guide to Dimensional Modeling (Vol. 3rd edition). Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=605991
- Luu H. Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark SQL, Structured Streaming and Spark Machine Learning Library. – Berkeley: Apress, 2018.
- Rohan Light, Beenish Saeed, Nathalie de Marcellis-Warin, Abdelaziz Khadraoui, Alison Holt, Benoit Aubert, David Sutton, Frédéric Gelissen, Alisdair McKenzie, Geoff Clarke, Rose Pan, & Ming Li. (2021). Data Governance : Governing Data for Sustainable Business. BCS, The Chartered Institute for IT.
- White, T. (2015). Hadoop: The Definitive Guide : Storage and Analysis at Internet Scale: Vol. 4th edition. O’Reilly Media.