• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2018/2019

Анализ данных в R, части 1 и 2

Статус: Курс по выбору (Финансы)
Направление: 38.04.08. Финансы и кредит
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: с онлайн-курсом
Прогр. обучения: Финансы
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Курс «Анализ данных в R, 1 и 2 части» предназначен для предоставления студентам базовых знаний в области R, свободной программной среде для статистических вычислений и графики. Курс начинается с введения в основы языка программирования R, типов данных и импорта набора данных в различных форматах. Затем студенты узнают, как собирать, очищать и подготавливать данные для дальнейшего анализа. Заключительная часть курса посвящена методикам визуализации данных с использованием R. Курс поддерживается онлайн-платформой для обучения Stepik.
Цель освоения дисциплины

Цель освоения дисциплины

  • В области обучения: подготовка в области основ экономических и математических знаний, позволяющая выпускнику успешно работать в избранной сфере деятельности, обладать предметно-специализированными компетенциями, способствующими его социальной мобильности и устойчивости на рынке труда.
  • В области воспитания личности: формирование социально-личностных качеств студентов: целеустремленности, организованности, трудолюбия, ответственности, коммуникативности, толерантности, повышение их общей культуры и расширение кругозора.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает базовые команды для анализа данных в R.
  • Умеет загружать данные, обрабатывать и визуализировать в среде RStudio.
  • Имеет навык анализа финансовых данных в R.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Предобработка данных
    Переменные. Работа с data frame. Элементы синтаксиса. Описательные статистики. Сохранение результатов.
  • Статистика в R
    Анализ номинативных данных. Сравнение двух групп. Применение дисперсионного анализа. Создание собственных функций. Корреляция и простая линейная регрессия (МНК). Множественная линейная регрессия. Диагностика модели. Логистическая регрессия. Экспорт результатов анализа из R.
  • Продвинутая предобработка данных
    Функции семейства apply. Работа с данными при помощи dplyr. Data.table.
  • Визуализация и R Markdown
    Грамматика ggplot2, функция qplot. Функция ggplot и различные geoms. Facet - способы группировки данных на графике. Scale и Theme: оси, легенда, внешний вид графика. Динамическая визуализация с plotly. R Markdown.
Элементы контроля

Элементы контроля

  • неблокирующий Самостоятельная работа
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.3 * Самостоятельная работа + 0.7 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Mailund, T. (2017). Beginning Data Science in R : Data Analysis, Visualization, and Modelling for the Data Scientist. New York: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1484645

Рекомендуемая дополнительная литература

  • Cirillo, A. (2017). R Data Mining. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1643003
  • Rao, U. H., & Nayak, U. (2017). Business Analytics Using R - A Practical Approach. [United States]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1406793