• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2017/2018

Программирование для анализа данных и воспроизводимые исследования

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Майнор
Когда читается: 1, 2 модуль
Преподаватели: Воскресенский Вадим Михайлович, Карепин Виктор Вадимович, Мусабиров Илья Леонидович
Язык: русский
Кредиты: 5
Контактные часы: 56

Программа дисциплины

Аннотация

Курс посвящен развитию базовых навыков работы с инструментальным средствам анализа данных и технологиям обработки данных. Курс дополняет и расширяет знания в области прикладной статистики и демонстрирует применения традиционных статистических методов (тестов) к различным задачам. Итогом курса является наличие у студентов навыков обработки уже собранных данных, а так же базовые навыки сбора данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • изучение особенностей различных методов сбора и агрегации данных, формирование навыков планирования сбора и обработки данных, изучение пакетов ориентированных на основные этапы подготовки данных и их анализа.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать ключевые понятия и задачи анализа данных, в том числе идеи “обучения с учителем” и “обучение без учителя”; основные методы эксплораторного анализа данных; примеры задач классификации и регрессии; понятие воспроизводимого исследования и то, как достигается воспроизводимость исследований
  • Уметь применять на практике основные структуры данных в R; производить простейшие статистические операции с помощью языка R; выполнять эксплораторный анализ данных; выбирать метод анализа, соответствующий исследовательской задаче; визуализировать результаты анализа; интерпретировать полученные результаты;
  • Иметь навыки (приобрести опыт): чтения и анализа академической литературы по анализу данных, использования современного инструментария, применяемого в анализе данных.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Воспроизводимые исследования
  • Эксплораторный анализ данных
  • Статистическое обучение. Введение в клиентскую аналитику
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа
  • неблокирующий Программный проект
  • неблокирующий Прохождение онлайн-упражнений
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.3 * Контрольная работа + 0.2 * Программный проект + 0.2 * Прохождение онлайн-упражнений + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Toomey, D. (2014). R for Data Science. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=933765

Рекомендуемая дополнительная литература

  • Luke, D. A. (2015). A User’s Guide to Network Analysis in R. Cham: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1114415
  • Newman, M. E. J. (2010). Networks : An Introduction. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=458550