Магистратура
2018/2019
Анализ данных в R, части 1 и 2
Статус:
Курс по выбору (Финансы)
Направление:
38.04.08. Финансы и кредит
Кто читает:
Департамент экономики и финансов
Где читается:
Факультет экономики, менеджмента и бизнес-информатики
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Преподаватели:
Паршаков Петр Андреевич
Прогр. обучения:
Финансы
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Курс «Анализ данных в R, 1 и 2 части» предназначен для предоставления студентам базовых знаний в области R, свободной программной среде для статистических вычислений и графики. Курс начинается с введения в основы языка программирования R, типов данных и импорта набора данных в различных форматах. Затем студенты узнают, как собирать, очищать и подготавливать данные для дальнейшего анализа. Заключительная часть курса посвящена методикам визуализации данных с использованием R. Курс поддерживается онлайн-платформой для обучения Stepik.
Цель освоения дисциплины
- В области обучения: подготовка в области основ экономических и математических знаний, позволяющая выпускнику успешно работать в избранной сфере деятельности, обладать предметно-специализированными компетенциями, способствующими его социальной мобильности и устойчивости на рынке труда.
- В области воспитания личности: формирование социально-личностных качеств студентов: целеустремленности, организованности, трудолюбия, ответственности, коммуникативности, толерантности, повышение их общей культуры и расширение кругозора.
Планируемые результаты обучения
- Знает базовые команды для анализа данных в R.
- Умеет загружать данные, обрабатывать и визуализировать в среде RStudio.
- Имеет навык анализа финансовых данных в R.
Содержание учебной дисциплины
- Предобработка данныхПеременные. Работа с data frame. Элементы синтаксиса. Описательные статистики. Сохранение результатов.
- Статистика в RАнализ номинативных данных. Сравнение двух групп. Применение дисперсионного анализа. Создание собственных функций. Корреляция и простая линейная регрессия (МНК). Множественная линейная регрессия. Диагностика модели. Логистическая регрессия. Экспорт результатов анализа из R.
- Продвинутая предобработка данныхФункции семейства apply. Работа с данными при помощи dplyr. Data.table.
- Визуализация и R MarkdownГрамматика ggplot2, функция qplot. Функция ggplot и различные geoms. Facet - способы группировки данных на графике. Scale и Theme: оси, легенда, внешний вид графика. Динамическая визуализация с plotly. R Markdown.
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.3 * Самостоятельная работа + 0.7 * Экзамен
Список литературы
Рекомендуемая основная литература
- Mailund, T. (2017). Beginning Data Science in R : Data Analysis, Visualization, and Modelling for the Data Scientist. New York: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1484645
Рекомендуемая дополнительная литература
- Cirillo, A. (2017). R Data Mining. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1643003
- Rao, U. H., & Nayak, U. (2017). Business Analytics Using R - A Practical Approach. [United States]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1406793