2019/2020





Программирование для анализа данных и воспроизводимые исследования
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Майнор
Кто читает:
Департамент информатики
Когда читается:
1, 2 модуль
Преподаватели:
Булыгин Денис Игоревич,
Маслинский Кирилл Александрович,
Поздняков Станислав Игоревич,
Суворова Алёна Владимировна
Язык:
русский
Кредиты:
5
Контактные часы:
56
Программа дисциплины
Аннотация
Курс посвящен развитию базовых навыков работы с инструментальным средствам анализа данных и технологиям обработки данных. Курс дополняет и расширяет знания в области прикладной статистики и демонстрирует применения традиционных статистических методов (тестов) к различным задачам. Итогом курса является наличие у студентов навыков обработки уже собранных данных, а так же базовые навыки сбора данных.
Цель освоения дисциплины
- Целями освоения дисциплины «Программирование для анализа данных и воспроизводимые исследования» являются изучение особенностей различных методов сбора и агрегации данных, формирование навыков планирования сбора и обработки данных, изучение пакетов ориентированных на основные этапы подготовки данных и их анализа.
Планируемые результаты обучения
- Владеет инструментарием визуализации и агрегации данных в R
- Выбирает тип графика в зависимости от задачи
- Анализирует данные в формате дат и текста на языке R
- Создает отчеты с помощью RMarkdown
- Знает основные понятия языка R
- Строит модели деревьев решений
- Интерпретирует и визуализирует результаты моделей
Содержание учебной дисциплины
- Воспроизводимые исследованияОбласть науки о данных. Воспроизводимые исследования. Создание отчетов и язык разметки RMarkdown. Введение в язык программирования R
- Статистическое обучение. Введение в клиентскую аналитикуВычислительная статистика и статистическое обучение в бизнесе, социологии, экономике. Деревья решений. Тестирование статистических гипотез. Клиентская аналитика
- Разведывательный анализ данныхВизуализация и агрегация данных. Работа с датами и текстовыми данными
Элементы контроля
- контрольная работа №1
- контрольная работа №2
- домашнее задание №1
- домашнее задание №2
- упражнения
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.15 * домашнее задание №1 + 0.15 * домашнее задание №2 + 0.2 * контрольная работа №1 + 0.2 * контрольная работа №2 + 0.3 * упражнения
Список литературы
Рекомендуемая основная литература
- Мастицкий С.Э., Шитиков В.К. - Статистический анализ и визуализация данных с помощью R - Издательство "ДМК Пресс" - 2015 - 496с. - ISBN: 978-5-97060-301-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/73072
Рекомендуемая дополнительная литература
- Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131