2021/2022
Введение в аналитическое программирование
Статус:
Майнор
Где читается:
Международная лаборатория прикладного сетевого анализа
Когда читается:
3, 4 модуль
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Сокол Анна Андреевна,
Хвацкий Григорий Сергеевич
Язык:
русский
Кредиты:
5
Контактные часы:
64
Программа дисциплины
Аннотация
В рамках этого курса слушатели познакомятся с работой с основными инструментами для анализа и визуализации данных, а также автоматизированной и воспроизводимой их обработки. Будут изучены основы работы с языками программирования R и Python и основные библиотеки, предназначенные для работы с разными типами данных в этих языках. Дополнительно будут изучены основы написания макросов для Microsoft Excel и создания отчетов с применением пакета Power BI. В рамках курса студенты должны выполнить одно домашнее задание и 10 коротких тестов, а также выполнить итоговый проект по анализу данных с использованием изученных инструментов.
Цель освоения дисциплины
- Развить у студентов навыки программирования для сбора, анализа и визуализации данных
Планируемые результаты обучения
- Знать базовый синтаксис и семантику языков программирования R, Python
- Знать основные принципы воспроизводимой обработки данных
- Знать основные принципы программной обработки неструктурированных данных
- Уметь использовать языки программирования R и Python для автоматизации задач предобработки и обработки данных, включая текстовые и графические
- Уметь создавать отчеты, используя инструменты языков R и Python
Содержание учебной дисциплины
- Введение в R, базовый синтаксис и базовые типы данных
- Оператор трубы в R, матрицы и списки, начало работы с данными
- Обработка данных в R с применением пакета data.table
- Обработка данных в R с применением набора пакетов Tidyverse
- Функциональное программирование в R, использование R для построения графиков и создания отчетов
- Введение в Python, базовый синтаксис и типы данных
- Работа с коллекциями в Python: списки, кортежи, словари, множества
- Работа с данными в Python с использованием пакетов Pandas и Numpy
- Автоматизированный сбор данных из онлайн-источников с применением библиотек Selenium и Requests
- Простые статистические модели в R и Python
- Начало работы с текстовыми данными в R и Python
- Начало работы с графами и сетевыми данными в R и Python
- Сочетание программ на нескольких языках программированиях в одном проекте, библиотеки для обмена сообщениями между программами