• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2021/2022

Исследование данных и визуализация

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Майнор
Когда читается: 1, 2 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Захарова Виктория Владиславовна, Сироткин Александр Владимирович, Суворова Алёна Владимировна, Сущевский Всеволод Вячеславович
Язык: русский
Кредиты: 5
Контактные часы: 56

Программа дисциплины

Аннотация

Первый курс майнора посвящен развитию базовых навыков работы с инструментальными средствами анализа данных. Студенты познакомятся с языком R - универсальным инструментом анализа и визуализации данных и машинного обучения, обладающим большим и дружелюбным сообществом. Мы научимся обрабатывать данные разных типов (чисел, категорий, строк, дат), делать полезные визуализации результатов и эффективные воспроизводимые отчёты и интерактивные презентации. Познакомимся с основными темами последующих курсов: этапами и инструментами исследования данных, применением статистических моделей к предсказанию данных. В результате освоения курса студенты будут способны быстро и эффективно провести исследование данных, графически исследовать ключевые закономерности и представить их в виде интерактивного отчета или дашборда, построить базовые предсказательные модели.
Цель освоения дисциплины

Цель освоения дисциплины

  • Изучение особенностей различных методов сбора и агрегации данных, формирование навыков планирования сбора и обработки данных, изучение пакетов ориентированных на основные этапы подготовки данных и их анализа
Планируемые результаты обучения

Планируемые результаты обучения

  • Анализирует данные в формате дат и текста на языке R
  • Владеет инструментарием визуализации и агрегации данных в R
  • Выбирает тип графика в зависимости от задачи
  • Знает основные понятия языка R
  • Интерпретирует и визуализирует результаты моделей
  • Создает отчеты с помощью RMarkdown
  • Строит модели деревьев решений
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Воспроизводимые исследования
  • Статистическое обучение. Введение в клиентскую аналитику
  • Разведывательный анализ данных
Элементы контроля

Элементы контроля

  • неблокирующий контрольная работа №1
  • неблокирующий контрольная работа №2
  • неблокирующий домашнее задание №1
    Домашнее задание представляет собой программный проект по анализу данных. Данные для задания и вопросы, на которые нужно дать ответы, предоставляются преподавателем. Работа выполняется индивидуально. Проект должен быть написан с ориентацией на “заказчика”, то есть понятен потенциальному клиенту, содержать все необходимые пояснения и интерпретации. Результаты представляются в виде 1) дашборда с таблицами / графиками по предоставленному преподавателем шаблону, и 2) отчета-пояснения, какие выводы должен сделать пользователь и какие элементы фокусируют внимание именно на этих выводах.
  • неблокирующий домашнее задание №2
    Домашнее задание представляет собой программный проект по анализу данных. Данные для задания предоставляются преподавателем. Работа выполняется индивидуально. Проект должен быть написан с ориентацией на “заказчика”, то есть понятен потенциальному клиенту, содержать все необходимые пояснения и интерпретации. Результаты представляются в виде одного из двух вариантов по выбору преподавателя: 1) полноценный отчет о результатах анализа, 2) дашборд с таблицами / графиками, показывающими результаты предсказания в определенных группах и результаты сравнения групп с помощью проверки гипотез, и отчет-пояснение к дашборду.
  • неблокирующий упражнения
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 2 модуль
    0.15 * домашнее задание №1 + 0.15 * домашнее задание №2 + 0.3 * упражнения + 0.2 * контрольная работа №2 + 0.2 * контрольная работа №1
Список литературы

Список литературы

Рекомендуемая основная литература

  • Мастицкий, С. Э. Статистический анализ и визуализация данных с помощью R / С. Э. Мастицкий, В. К. Шитиков. — Москва : ДМК Пресс, 2015. — 496 с. — ISBN 978-5-97060-301-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/73072 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131