• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2022/2023

Приложения и практика анализа данных

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Майнор
Когда читается: 3, 4 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Попов Александр Денисович, Сироткин Александр Владимирович, Суворова Алёна Владимировна
Язык: русский
Кредиты: 5
Контактные часы: 48

Программа дисциплины

Аннотация

Курс посвящен более глубокому погружению студентов в специализированную область анализа данных и выполнение итогового практического проекта с использованием всех компетенций, приобретённых в процессе освоения майнора. Учитывая междисциплинарную важность майнора, в рамках базовой структуры и требований курса могут быть реализованы проекты из различных направлений и предметных областей, причем эти проекты могут быть как исследовательскими, так и прикладными. В рамках курса студентам будут предложены групповые и индивидуальные проекты, а также возможность предложить собственный проект. Кроме того, в первой части курса рассматриваются общие принципы построения продуктов, основанных на данных, изучаются инструменты для создания веб-приложений на R и особенности создания пользовательских интерфейсов.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Приложения и практика анализа данных» являются изучение особенностей разработки приложений и сервисов построенных на основе методов анализа данных, особенностей совместной разработки, разработки пользовательского интерфейса и работы с системами контроля версий.
Планируемые результаты обучения

Планируемые результаты обучения

  • Автоматизирует сбор и анализ информации из различных источников в глобальных компьютерных сетях
  • Владеет инструментами совместной разработки
  • Внедряет алгоритмы построения рекомендаций в аналитические сервисы
  • Планирует самостоятельную работу при выполнении группового проекта
  • Проектирует интерфейсы приложений средствами языка R
  • Строит интерактивные визуализации средствами языка R
  • Формулирует задачу построения системы рекомендаций на основе заданного или самостоятельно подобранного набора данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Создание пользовательского интерфейса
  • Рекомендательные системы
  • Работа над коллективными проектами
Элементы контроля

Элементы контроля

  • блокирует часть оценки/расчета Дневники проекта
    Дневники работы над проектом представляют собой регулярные письменные отчеты о прогрессе в выполнении проекта. Дневники заполняются в виде комментария в ветке проекта.
  • неблокирующий Защита идеи
    Видео на 3-5 минут с описанием идеи, ролей в команде и основных положений из canvas (ожидаемые сценарии, функциональность, данные, пользователи, оценивание, интерфейс). Записывается с участием всех членов команды
  • неблокирующий Защита проекта с демонстрацией
    Групповая презентация результатов проекта, включая демонстрацию работы сервиса (в формате видеозаписи на 7-10 минут) + ссылка на работающее приложение Обязательными разделами доклада являются: 1. Общее описание идеи сервиса 2. Описание данных 3. Состав команды и распределение ролей 4. Использованные методы анализа 5. Демонстрация примеров работы проекта 6. Оценивание разработанной системы. 7. Возникшие в процессе выполнения проекта сложности, изменения исходной идеи
  • неблокирующий Групповой отчет
    Структурированный групповой письменный отчет по проекту с ответами на вопросы, полученные во время взаимного оценивания и от преподавателей во время проверки.
  • неблокирующий Схема (canvas) проекта
    Схематичное описание проекта по представленному шаблону (сфера, цели, функциональность, методы, интрефейс, оценивание)
  • неблокирующий Взаимное оценивание идеи
    Каждый студент индивидуально оценивает видео-презентации трех проектов (два по предварительному распределению, один по выбору студента). Для каждого проекта дается общая оценка, формулируются вопросы, даются рекомендации по улучшению, дополнению или изменению, а также приводятся примеры, на которых хотелось бы проверить рекомендательную систему.
  • неблокирующий Взаимное оценивание проектов
    Каждый студент индивидуально оценивает видео-презентации трех проектов (два по предварительному распределению, один по выбору студента). Для каждого проекта дается общая оценка, формулируются вопросы, приводятся примеры сценариев, на которых хотелось бы проверить рекомендательную систему.
  • неблокирующий Ответы на вопросы по проекту
    Ответы на индивидуальные вопросы по проекту, полученные от преподавателей во время проверки.
  • неблокирующий Упражнения
    Для закрепления навыков по работе с инструментарием студентам предлагается выполнить онлайн-упражнения на закрепление и проверку усвоения материала на онлайн-платформе. Их прохождение играет формативную роль: количество попыток не ограничивается. Работа выполняется на дому и сдается до установленной даты экзамена.
  • неблокирующий Домашнее задание
    Задание на повторение интерфейса по представленному в задании шаблону
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.05 * Схема (canvas) проекта + 0.1 * Домашнее задание + 0.2 * Групповой отчет + 0.05 * Взаимное оценивание идеи + 0.05 * Защита идеи + 0.1 * Защита проекта с демонстрацией + 0.15 * Ответы на вопросы по проекту + 0.15 * Дневники проекта + 0.1 * Взаимное оценивание проектов + 0.05 * Упражнения
Список литературы

Список литературы

Рекомендуемая основная литература

  • Munzert S. Automated data collection with R: a practical guide to Web scraping and text mining. Chichester, West Sussex, United Kingdom: Wiley, 2014. 1 p.
  • Siegel, E. (2016). Predictive Analytics : The Power to Predict Who Will Click, Buy, Lie, or Die (Vol. Revised and Updated edition). Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1157317
  • Анализ данных : учебник для академического бакалавриата / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2019. — 490 с. — (Бакалавр. Академический курс). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/432178 (дата обращения: 28.08.2023).

Рекомендуемая дополнительная литература

  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
  • Ledolter, J. (2013). Data Mining and Business Analytics with R. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=587979
  • Zhao, Y., & Cen, Y. (2013). Data Mining Applications with R. Amsterdam: Academic Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=543675