• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2021/2022

Методы и системы обработки больших данных

Направление: 01.03.02. Прикладная математика и информатика
Когда читается: 4-й курс, 1-3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 5
Контактные часы: 60

Программа дисциплины

Аннотация

В рамках курса студенты узнают о различных видах программных решений, используемых при работе с большими данными: фреймворке hadoop и его составляющих, MPP СУБД Greenplum, СУБД Clickhouse, Apache Airflow и других инструментах. Узнают какие задачи решают инженеры данных и какие приемы используют. Студенты на практике реализуют несколько ETL процессов, с помощью указанных выше инструментов
Цель освоения дисциплины

Цель освоения дисциплины

  • Уметь реализовать DAG для переноса данных между системами хранения
  • Настраивать промежуточное ПО (Airflow, prefect) для организации ETL-процессов
  • Настраивать рабочее место инженера данных
  • Извлекать и записывать данные в Kafka
  • Объяснять нюансы работы с Kafka
  • Извлекать и записывать данные в Clickhouse
  • Знать нюансы работы с СУБД Clickhouse
  • Извлекать данные из СУБД или MPP, используя Apache Spark
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение
  • Распределённые файловые системы. HDFS
  • Java для BigData-инженеров
  • MapReduce
  • SQL поверх больших данных
  • Пакетная обработка данных. Apache Spark
  • Real-time обработка данных
  • NoSQL и большие данные
  • Администрирование сервисов обработки больших данных
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Контрольная работа 1
  • неблокирующий Работа на семинарах 1
  • неблокирующий Письменный экзамен
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • неблокирующий Домашнее задание 4
  • неблокирующий Домашнее задание 5
  • неблокирующий Домашнее задание 6
  • неблокирующий Контрольная работа 2
  • неблокирующий Контрольная работа 3
  • неблокирующий Контрольная работа 4
  • неблокирующий Работа на семинарах 2
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 3 модуль

Авторы

  • Ивченко Олег Николаевич