• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2019/2020

Приложения и практика анализа данных

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Майнор
Когда читается: 3, 4 модуль
Преподаватели: Булыгин Денис Игоревич, Маслинский Кирилл Александрович, Сироткин Александр Владимирович, Суворова Алёна Владимировна
Язык: русский
Кредиты: 5
Контактные часы: 38

Программа дисциплины

Аннотация

Курс посвящен более глубокому погружению студентов в специализированную область анализа данных и выполнение итогового практического проекта с использованием всех компетенций, приобретённых в процессе освоения майнора Data Science. Учитывая междисциплинарную важность майнора, в рамках базовой структуры и требований курса Applications and Practice of Data Science могут быть реализованы проекты из различных направлений и предметных областей. В рамках курса студентам будут предложены групповые и индивидуальные проекты, а так же возможность предложить собственный проект.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Приложения и практика анализа данных» являются изучение особенностей разработки приложений и сервисов построенных на основе методов анализа данных, особенностей совместной разработки, разработки пользовательского интерфейса и работы с системами контроля версий.
Планируемые результаты обучения

Планируемые результаты обучения

  • Формулирует задачу построения системы рекомендаций на основе заданного или самостоятельно подобранного набора данных
  • Внедряет алгоритмы построения рекомендаций в аналитические сервисы
  • Проектирует интерфейсы приложений средствами языка R
  • Строит интерактивные визуализации средствами языка R
  • Автоматизирует сбор и анализ информации из различных источников в глобальных компьютерных сетях
  • Планирует самостоятельную работу при выполнении группового проекта
  • Владеет инструментами совместной разработки
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Создание пользовательского интерфейса
    Введение в html, основные элементы веб-интерфейса. Взаимодействие с пользователем. Архитектура приложений на Shiny. Элементы пользовательского интерфейса: создание и обработка взаимодействий. Интерактивные визуализации
  • Рекомендательные системы
    Создание рекомендательных систем на основе рейтингов товаров. Коллаборативная фильтрация по пользователям (user-based) и по товарам (item-based). Альтернативные методы формирования рекомендаций (SVM разложение, рекомендации наиболее популярных товаров). Машинное обучение в рекомендательных системах. Оценки качества рекомендаций, на основе оценки точности восстанавливаемых рейтингов. Оценки качества рекомендаций, на основе решения задачи бинарной классификации на подходящие и не подходящие рекомендации.
  • Работа над коллективными проектами
    Основы работы с системой контроля версий git и сервисом github.com. Применение системы контроля версий в среде разработки RStudio. Основы совместной работы над общим проектом. Выбор направления проекта и подготовка плана работы. Выполнение учебного проекта. Промежуточная и итоговая защита проекта. Подготовка отчета. Презентация результатов
Элементы контроля

Элементы контроля

  • блокирует часть оценки/расчета Дневники проекта
    Дневники работы над проектом представляют собой письменные ответы на вопросы о выполненных на текущем шаге заданиях. Дневники заполняются раз в две недели
  • неблокирующий Защита идеи
    Защита идеи проходит в форме групповой презентации промежуточных результатов проекта. Обязательными разделами доклада являются: 1. Общее описание идеи сервиса 2. Описание данных или план по сбору данных (необходимые переменные, источник) 3. Состав команды и распределение ролей 4. Планируемые методы анализа (где использованы методы машинного обучения, как строится рекомендация, общая логика обработки данных) 5. Схематичное представление интерфейса сервиса (спецификация того, что должен ввести пользователь и в какой форме представлена рекомендация) 6. Планируемые сроки выполнения проекта
  • неблокирующий Защита проекта
    Защита проекта проходит в форме групповой презентации результатов проекта, включая демонстрацию работы сервиса (в формате видеозаписи). Обязательными разделами доклада являются: 1. Общее описание идеи сервиса 2. Описание данных 3. Состав команды и распределение ролей 4. Использованные методы анализа 5. Демонстрация примеров работы проекта 6. Возникшие в процессе выполнения проекта сложности, изменения исходной идеи
  • неблокирующий Отчет
    Итоговый отчет по проекту заполняется индивидуально и описывает процедуру работы над проектом, понимание общей структуры проекта и индивидуальный вклад в разработку, включая конкретные примеры кода, написанного студентом, и обоснование выполненных им действий. Кроме того, в итоговый отчет включаются ответы на замечания и вопросы по результатам рецензирования видеопрезентаций
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.3 * Дневники проекта + 0.1 * Защита идеи + 0.3 * Защита проекта + 0.3 * Отчет
Список литературы

Список литературы

Рекомендуемая основная литература

  • Munzert S. Automated data collection with R: a practical guide to Web scraping and text mining. Chichester, West Sussex, United Kingdom: Wiley, 2014. 1 p.
  • Siegel, E. (2016). Predictive Analytics : The Power to Predict Who Will Click, Buy, Lie, or Die (Vol. Revised and Updated edition). Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1157317
  • Под ред. Мхитаряна В.С. - АНАЛИЗ ДАННЫХ. Учебник для академического бакалавриата - М.:Издательство Юрайт - 2019 - 490с. - ISBN: 978-5-534-00616-2 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/analiz-dannyh-432178

Рекомендуемая дополнительная литература

  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
  • Ledolter, J. (2013). Data Mining and Business Analytics with R. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=587979
  • Zhao, Y., & Cen, Y. (2013). Data Mining Applications with R. Amsterdam: Academic Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=543675