2017/2018
Программирование для анализа данных и воспроизводимые исследования
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Майнор
Кто читает:
Департамент социологии
Где читается:
Санкт-Петербургская школа экономики и менеджмента
Когда читается:
1, 2 модуль
Преподаватели:
Воскресенский Вадим Михайлович,
Карепин Виктор Вадимович,
Мусабиров Илья Леонидович
Язык:
русский
Кредиты:
5
Контактные часы:
56
Программа дисциплины
Аннотация
Курс посвящен развитию базовых навыков работы с инструментальным средствам анализа данных и технологиям обработки данных. Курс дополняет и расширяет знания в области прикладной статистики и демонстрирует применения традиционных статистических методов (тестов) к различным задачам. Итогом курса является наличие у студентов навыков обработки уже собранных данных, а так же базовые навыки сбора данных.
Цель освоения дисциплины
- изучение особенностей различных методов сбора и агрегации данных, формирование навыков планирования сбора и обработки данных, изучение пакетов ориентированных на основные этапы подготовки данных и их анализа.
Планируемые результаты обучения
- Знать ключевые понятия и задачи анализа данных, в том числе идеи “обучения с учителем” и “обучение без учителя”; основные методы эксплораторного анализа данных; примеры задач классификации и регрессии; понятие воспроизводимого исследования и то, как достигается воспроизводимость исследований
- Уметь применять на практике основные структуры данных в R; производить простейшие статистические операции с помощью языка R; выполнять эксплораторный анализ данных; выбирать метод анализа, соответствующий исследовательской задаче; визуализировать результаты анализа; интерпретировать полученные результаты;
- Иметь навыки (приобрести опыт): чтения и анализа академической литературы по анализу данных, использования современного инструментария, применяемого в анализе данных.
Содержание учебной дисциплины
- Воспроизводимые исследования
- Эксплораторный анализ данных
- Статистическое обучение. Введение в клиентскую аналитику
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.3 * Контрольная работа + 0.2 * Программный проект + 0.2 * Прохождение онлайн-упражнений + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Toomey, D. (2014). R for Data Science. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=933765
Рекомендуемая дополнительная литература
- Luke, D. A. (2015). A User’s Guide to Network Analysis in R. Cham: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1114415
- Newman, M. E. J. (2010). Networks : An Introduction. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=458550