• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2021/2022

Введение в аналитическое программирование

Статус: Майнор
Когда читается: 3, 4 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Сокол Анна Андреевна, Хвацкий Григорий Сергеевич
Язык: русский
Кредиты: 5
Контактные часы: 64

Программа дисциплины

Аннотация

В рамках этого курса слушатели познакомятся с работой с основными инструментами для анализа и визуализации данных, а также автоматизированной и воспроизводимой их обработки. Будут изучены основы работы с языками программирования R и Python и основные библиотеки, предназначенные для работы с разными типами данных в этих языках. Дополнительно будут изучены основы написания макросов для Microsoft Excel и создания отчетов с применением пакета Power BI. В рамках курса студенты должны выполнить одно домашнее задание и 10 коротких тестов, а также выполнить итоговый проект по анализу данных с использованием изученных инструментов.
Цель освоения дисциплины

Цель освоения дисциплины

  • Развить у студентов навыки программирования для сбора, анализа и визуализации данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать базовый синтаксис и семантику языков программирования R, Python
  • Знать основные принципы воспроизводимой обработки данных
  • Знать основные принципы программной обработки неструктурированных данных
  • Уметь использовать языки программирования R и Python для автоматизации задач предобработки и обработки данных, включая текстовые и графические
  • Уметь создавать отчеты, используя инструменты языков R и Python
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в R, базовый синтаксис и базовые типы данных
  • Оператор трубы в R, матрицы и списки, начало работы с данными
  • Обработка данных в R с применением пакета data.table
  • Обработка данных в R с применением набора пакетов Tidyverse
  • Функциональное программирование в R, использование R для построения графиков и создания отчетов
  • Введение в Python, базовый синтаксис и типы данных
  • Работа с коллекциями в Python: списки, кортежи, словари, множества
  • Работа с данными в Python с использованием пакетов Pandas и Numpy
  • Автоматизированный сбор данных из онлайн-источников с применением библиотек Selenium и Requests
  • Простые статистические модели в R и Python
  • Начало работы с текстовыми данными в R и Python
  • Начало работы с графами и сетевыми данными в R и Python
  • Сочетание программ на нескольких языках программированиях в одном проекте, библиотеки для обмена сообщениями между программами
Элементы контроля

Элементы контроля

  • неблокирующий Итоговый проект
  • неблокирующий Промежуточное домашнее задание
  • неблокирующий 10 Промежуточных тестов
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.3 * 10 Промежуточных тестов + 0.3 * Промежуточное домашнее задание + 0.4 * Итоговый проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python 3, Прохоренок, Н. А., 2016
  • Zumel, N. V. (DE-588)1055925899, (DE-627)792891783, (DE-576)41194200X, aut. (2020). Practical data science with R Nina Zumel and John Mount ; foreword by Jeremy Howard and Rachel Thomas.