• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2021/2022

Хранилища данных

Статус: Курс обязательный (Бизнес-информатика)
Направление: 38.03.05. Бизнес-информатика
Когда читается: 3-й курс, 1, 2 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 4

Программа дисциплины

Аннотация

Целью освоения дисциплины «Хранилища данных» является обеспечение обучающихся основополагающими знаниями в области современных способов хранения информации и анализа данных, а также приобретение слушателями навыков по созданию хранилищ данных заданной архитектуры и по анализу данных. В ходе изучения дисциплины перед обучающимися ставятся следующие задачи: изучение методов анализа данных; изучение методологии создания хранилищ данных; освоение основных технологий для создания хранилищ данных; изучение программных средств, используемых при создании хранилищ данных; формирование практических навыков проектирования хранилищ данных; формирование навыков работы со специальной литературой.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование знаний, умений и навыков проектирования и администрирования хранилищ данных (ХД), разработки приложений (внешних интерфейсов) ХД, использования средств многомерного анализа данных класса OLAP.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знание подходов к построению ХД и сфер их применимости
  • Знание особенностей многомерной модели ХД
  • Знание архитектуры программных средств, работающих с ХД
  • Знание теории многомерных ХД: схемы типа «Звезда», «Снежинка», метод Data Vault Modeling, ETL-процедуры, ROLAP и др.
  • Владение навыками проектирования структуры ХД
  • Умение проектировать ХД вручную и с использованием выбранного CASE-средства
  • Умение использовать инструментальные средства СУБД при реализации модели ХД
  • Знание языка манипулирования (построения запросов) многомерными данными MDX
  • Владение навыками формирования MDX-запросов к ХД
  • Владение навыками анализа данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Хранилища данных (ХД) - причины возникновения
    Проблема хранения данных при принятии решений. Причины появления Хранилищ данных. Применение хранилищ данных. Ключевые области применения - отчетность, интеллектуальный анализ данных, операционное реагирование (KPI). Отличия Хранилищ от операционных и прочих баз данных. Хранилище как "единый прозрачный источник данных о бизнесе компании для ее руководства". Место хранилища в IT-инфраструктуре предприятия. Компоненты хранилища и их связь с прочими элементами IT-инфраструктуры. Понятие основных данных (НСИ). Системы управления НСИ.
  • Архитектура ХД
    Типовые архитектуры хранилищ данных, глобальное хранилище данных, централизованное хранилище данных, распределенное хранилище данных, киоски (витрины) данных, взаимосвязанные киоски данных, независимые киоски данных, корпоративная информационная фабрика, хранилище данных с архитектурой шины данных, федеративное хранилище данных.
  • Основные принципы проектирования ХД
    Инструменты (CASE-средства) для проектирования ХД. Методы проектирования Центрального хранилища данных. Метод многомерного моделирования: схема «Звезда», схема «Снежинка», преимущества и недостатки. Подход к построению ХД - Data Vault. Моделирование временных данных. Жизненный цикл разработки хранилища данных.
  • Проектирование и разработка процесса наполнения ХД
    Основные этапы задачи наполнения хранилища. Подходы ETL/ELT, различия между ними, преимущества и недостатки. Основные ETL/ELT инструменты. Задача отслеживания изменений в контексте хранилища. Медленно меняющиеся измерения (SCD).
  • Физическая модель ХД
    Денормализация данных, оптимизация запросов, использование индексов, партиций. Использование специальных конструкций языка SQL.
  • Использование ХД в процессе анализа данных
    История возникновения систем бизнес-анализа (BI), основные игроки и тенденции на рынке BI. Место ХД в системах BI. Системы принятия решений, OLAP. Системы отчетности. Язык запросов MDX.
Элементы контроля

Элементы контроля

  • неблокирующий Работа на лекции
    Студентам дается задание в конце лекции в виде теста
  • неблокирующий Работа на семинаре
    На семинарах дается оцениваемое домашнее задание
  • неблокирующий Контрольная работа
    Набор тестовых заданий на один час
  • неблокирующий Контрольное домашнее задание
    Групповой проект
  • неблокирующий Экзамен
    Тест по окончанию курса. Тест представляет из себя набор вопросов закрытого типа. Форма экзамена: Экзамен проводится в письменной форме. Платформа проведения: Экзамен проводится на платформе Canvas LMS. Для участия в экзамене студент обязан: Не позднее 7 дней до проведения экзамена проверить работоспособность компьютерного оборудования, необходимого для сдачи экзамена и убедиться в соответствие имеющегося оборудования требованиям к компьютеру для участия в экзамене на платформе Canvas LMS; Войти на платформу Canvas LMS под личной учетной записью (используется аккаунт студента @edu.hse.ru); Перед началом экзамена проверить скорость работы сети Интернет (для наилучшего результата рекомендуется подключение компьютера к сети через кабель); Подготовить необходимые для проведения экзамена инструменты: ручка, листы бумаги, калькулятор и т. д.; Отключить в диспетчере задач компьютера иные приложения, кроме браузера, в котором будет выполняться вход на платформу Canvas LMS, а также необходимого окружения СУБД. В случае, если одно из необходимых условий участия в экзамене невозможно выполнить, необходимо за 2 недели до даты проведения экзамена проинформировать об этом преподавателя или сотрудника учебного офиса для принятия решения об участии студента в экзаменах. Во время экзамена студентам запрещено: Пользоваться конспектами, учебниками, прочими учебными материалами; Покидать место выполнения экзаменационного задания; Пользоваться умными гаджетами (смартфон, планшет и др.); Привлекать посторонних лиц для помощи в проведении экзамена, разговаривать с посторонними во время выполнения заданий; Вслух громко зачитывать задания. Во время экзамена студентам разрешено: Использовать бумагу, ручку для ведения записей, расчетов; Использовать калькулятор для ведения расчетов; Запрашивать у преподавателя дополнительную информацию, связанную с выполнением экзаменационного задания; Взаимодействовать с другими студентами по разрешению преподавателя. В случае долговременного нарушения связи с платформами MS Teams и Canvas LMS во время выполнения экзаменационного задания, студент должен уведомить об этом преподавателя, зафиксировать факт потери связи с платформой (скриншот, ответ от провайдера сети Интернет) и обратиться в учебный офис с объяснительной запиской о случившемся для принятия решения о пересдаче экзамена.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.15 * Контрольная работа + 0.34 * Контрольное домашнее задание + 0.1 * Работа на лекции + 0.11 * Работа на семинаре + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Гордеев С. И., Волошина В. Н. - ОРГАНИЗАЦИЯ БАЗ ДАННЫХ В 2 Ч. ЧАСТЬ 1 2-е изд., испр. и доп. Учебник для вузов - М.:Издательство Юрайт - 2020 - 310с. - ISBN: 978-5-534-04469-0 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/organizaciya-baz-dannyh-v-2-ch-chast-1-452928
  • Гордеев С. И., Волошина В. Н. - ОРГАНИЗАЦИЯ БАЗ ДАННЫХ В 2 Ч. ЧАСТЬ 2 2-е изд., испр. и доп. Учебник для вузов - М.:Издательство Юрайт - 2020 - 513с. - ISBN: 978-5-534-04470-6 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/organizaciya-baz-dannyh-v-2-ch-chast-2-454122
  • Кондрашов Ю.Н. - Анализ данных и машинное обучение на платформе MS SQL Server - Русайнс - 2020 - 303с. - ISBN: 978-5-4365-3369-8 - Текст электронный // ЭБС BOOKRU - URL: https://book.ru/book/933497
  • Кондрашов Ю.Н. - Эффективное использование СУБД MS SQL Server - Русайнс - 2020 - 121с. - ISBN: 978-5-4365-4597-4 - Текст электронный // ЭБС BOOKRU - URL: https://book.ru/book/935743
  • Парфенов Ю. П. ; под науч. ред. Папуловской Н.В. - ПОСТРЕЛЯЦИОННЫЕ ХРАНИЛИЩА ДАННЫХ. Учебное пособие для вузов - М.:Издательство Юрайт - 2020 - 121с. - ISBN: 978-5-534-09837-2 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/postrelyacionnye-hranilischa-dannyh-453758
  • Стружкин Н. П., Годин В. В. - БАЗЫ ДАННЫХ: ПРОЕКТИРОВАНИЕ. Учебник для вузов - М.:Издательство Юрайт - 2020 - 477с. - ISBN: 978-5-534-00229-4 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/bazy-dannyh-proektirovanie-450165

Рекомендуемая дополнительная литература

  • - Интеллектуальный анализ данных средствами MS SQL Server 2008 - Национальный Открытый Университет "ИНТУИТ" - 2016 - 337с. - ISBN: - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100609
  • Hartmann, S., & Alfermann, D. (2019). Practical Guide to SAP HANA and Big Data Analytics. Espresso Tutorials.
  • Perkins, L., Redmond, E., & Wilson, J. R. (2018). Seven Databases in Seven Weeks : A Guide to Modern Databases and the NoSQL Movement (Vol. Second edition). Raleigh, N. C: Pragmatic Bookshelf. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1806794
  • Марасанов А.М., Аносова Н.П., Бородин О.О. - Распределенные базы и хранилища данных - Национальный Открытый Университет "ИНТУИТ" - 2016 - 254с. - ISBN: - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100445
  • Стружкин Н. П., Годин В. В. - БАЗЫ ДАННЫХ: ПРОЕКТИРОВАНИЕ. ПРАКТИКУМ. Учебное пособие для вузов - М.:Издательство Юрайт - 2020 - 291с. - ISBN: 978-5-534-00739-8 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/bazy-dannyh-proektirovanie-praktikum-451246