• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2019/2020

Функциональный язык запросов DAX для анализа данных

Статус: Курс по выбору (Журналистика данных)
Направление: 42.04.02. Журналистика
Когда читается: 2-й курс, 3 модуль
Формат изучения: Blended
Прогр. обучения: Журналистика данных
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Относительно новый язык DAX (Data Analysis Expressions) был разработан именно для работы с табличными данными – это язык формул, который применим в Excel, Power BI, PowerPivot, табличной модели SSAS. Созданный изначально для продвинутой бизнес аналитики, этот простой в изучении язык также очень полезен всем аналитикам данных для эффективного и корректного извлечения необходимых показателей и корректного анализа табличных данных любой сложности. Курс знакомит студентов с языком DAX, изучает типы вычислений и функции DAX, переменные языка, связи между таблицами, фильтрацию и подсчёт значений средствами DAX.
Цель освоения дисциплины

Цель освоения дисциплины

  • Сформировать у студентов понимание идеологии, возможностей и особенностей современных систем интерактивной аналитики на примере Microsoft Power BI с языками DAX и M
Результаты освоения дисциплины

Результаты освоения дисциплины

  • Понимает значимость и основные принципы Data-Driven Decision Management (DDDM) и Business Intelligence (BI)
  • Понимает идеологию применения интерактивных отчётов (dashboards) Microsoft Power BI и Excel
  • Строит реляционную модель данных
  • Заполняет реляционную модель данными из внешних источников
  • Строит базовый эксплораторный отчёт
  • Выбирает метод и инструмент анализа данных
  • Ставит задачу аналитику и интерпретирует результаты
  • Понимает особенности современных подходов к управлению данными и принятию решений на основе данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Интерактивный анализ данных и бизнес-аналитика
    Информация и данные. Метаданные и их уровни. Форматы данных. Наборы данных и источники данных. Протоколы и интерфейсы доступа к данным. Большие данные. Как связаны понятия Business Intelligence (BI), Data Analysis, Data Analytics, Data Mining. Методология DDDM. Интерактивные отчёты и их классификация. Мастер-данные. Политики управления данными. Понятие качества данных и его основные метрики. Персональные данные. Защищённое хранение и локализация персональных данных. Геграфические данные. Данные в виде временных рядов. Экосистема Power BI. Power BI Desktop и web-версия, просмотр и редактирование интерактивных отчётов. Языки M и DAX. Отличия Excel (Power Pivot, Power Query и другие компоненты) от Power BI.
  • Тема 2. Подготовка данных и язык M
    Моделирование данных. Дополнительно об уровнях абстракции. Концептуальные, логические и физические модели данных. Управление данными. Базы данных (БД) и системы управления базами данных (СУБД). Хранилища данных и витрины данных. Объекто-признаковые данные. Признаки и атомарные данные, шкалы. Суммаризация данных. Реляционная модель данных и её свойства. От предметной области к моделям данных. Концептуальная модель «сущность-связь», ER-диаграммы. Сущности и их выделение, экземпляры сущностей. Связи, их модальность и множественность. Ссылочная целостность реляционных данных. Модель «таблица-связь» и некоторые понятия реляционный алгебры для понимания соединений. Реляционные БД. Системы управления реляционными БД. Доступ к SQL-серверам. Модель данных Power BI и реляционная модель. Отношение [relation] между элементами данных в модели данных Power BI. Методология «Extract-Transform-Load (ETL)». Загрузка и очистка данных, Power Query и язык M. Основные задачи очистки данных, преобразование форматов в Power Query. Визуализация статистических характеристик. Базовые визуализаторы Power BI.
  • Тема 3. Интерактивная визуализация и язык DAX
    Основные понятия отчёта Power BI и их взаимосвязь. Контекст вычисления (контекст строки, контекст фильтра и преобразование одного типа контекста в другой). Вычисляемый столбцец [calculated column], мера [measure], иерархия [hierarchy], фильтр [filter], срез [slider] и режим детализации [drill mode]. Меры против вычисляемых столбцов. Где проходит граница между предобработкой и анализом данных? Язык DAX. Синтаксис и семантика основных конструкций. Основные функции языка. Реализация работы с соединениями в DAX. Работа с датой и временем. Таблица-календарь. Автоматическое порождение иерархий отметок и интервалов времени. Особенности работы с географическими данными в Power BI. Координаты и адреса. Иерархия геоданных. Методы оптимизации производительности интерактивных отчётов. Особенности мер.
  • Тема 4. Комплексные отчёты и интеграция
    Поддержка процессов сквозной аналитики в организации. Интерактивная аналитика для принятия решений. Сложные системы справочников и углублённое понимание детализации углублением и обобщением [drill down and up]. Сложная визуализация в интерактивных отчётах. Работа с многостраничными отчётами. Магазин визуализаторов. Пользовательские визуализаторы. Визуализаторы на языках Python и R. Интеллектуализация интерактивных отчётов. Quick Insights и AI Insights. Доступ к отчётам. Обновление отчётов и Data Gateway. Потоковые данные. Power BI Premium. Основные тренды в интерактивной аналитике и развитие Power BI.
Элементы контроля

Элементы контроля

  • неблокирующий Created with Sketch. Тест 1
  • неблокирующий Created with Sketch. Домашнее задание 1
  • неблокирующий Created with Sketch. Тест 2
  • неблокирующий Created with Sketch. Домашнее задание 2
  • неблокирующий Created with Sketch. Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    0.175 * Домашнее задание 1 + 0.245 * Домашнее задание 2 + 0.105 * Тест 1 + 0.175 * Тест 2 + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Russo, M., & Ferrari, A. (2015). The Definitive Guide to DAX : Business Intelligence with Microsoft Excel, SQL Server Analysis Services, and Power BI. Redmond, Washington: Microsoft Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1601522
  • Steven Feiner, S. Card, J. Mackinlay, & G. Robertson. (2009). 1812. (Popularized by E Tufte, The Visual Display of Quantitative Information). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.CF0DC995

Рекомендуемая дополнительная литература

  • Iliinsky, N. P. N., & Steele, J. (2010). Beautiful Visualization : Looking at Data Through the Eyes of Experts. Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415208
  • Kern, J. D. (2009). Supercharge Your Excel Sum Operations. Journal of Accountancy, 208(1), 48–52. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=bsu&AN=43766644
  • Seamark, P. (2018). Beginning DAX with Power BI : The SQL Pro’s Guide to Better Business Intelligence. [United States]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1743806