• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2023/2024

Статистический анализ в Python

Статус: Дисциплина общефакультетского пула
Когда читается: 3 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 4
Контактные часы: 40

Программа дисциплины

Аннотация

Курс "Статистический анализ в Python" ориентирован на студентов, образование которых связано с анализом данных и/или они планируют использовать анализ данных в своей будущей профессиональной деятельности. Свободно распространяемая платформа CPython и различные проекты, основанные на ней (библиотеки) предоставляют богатые возможности для анализа данных без увеличения стоимости образования и/или коммерческих проектов. В рамках курса студенты познакомяться с вычислительными возможностями платформы и наиболее значимых библиотек, приобретут навыки самостоятельного использования языка Python и различных прикладных библиотек для проведения статистчиеского анализа данных и создания проблемно ориентированных приложений.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных с управлением данными— организацией сбора и хранения данных, выбором данных по определенным критериям, содержащим несколько условий, модификацией данных, обменом данными между различными приложениями, интеграцией данных, полученных из различных источников.
  • Целью курса является развитие у слушателей навыков разведочного анализа данных с использованием языка Python и стека созданных для него библиотек, образующих платформу для анализа данных.
  • Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных с элементарным анализом данных — числовым анализом: подсчетом описательных числовых статистик адекватных типу данных, графическим анализом: визуализацией статистических свойств данных.
  • Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных со статистическим анализом данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать основные функции системной библиотеки Python 3 (текущая версия).
  • Знать структуру (основные разделы) библиотеки matplotlib (текущая версия).
  • Знать структуру (основные разделы) библиотеки NumPy(текущая версия).
  • Знать структуру (основные разделы) библиотеки Pandas(текущая версия).
  • Знать грамматику языка Python 3 (текущая версия) и стандарты разработки приложений на языке Python 3 (текущая версия).
  • Уметь использовать библиотеку NumPy (текущая версия) для организации предварительного анализа данных.
  • Уметь использовать библиотеку NumPy (текущая версия) для организации хранения данных и управления данными.
  • Уметь использовать библиотеку Pandas для предварительного анализа данных.
  • Учесть использовать библиотеку matplotlib для графического анализа данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы языка Python
  • Аналитические возможности библиотеки NumPy
  • Основы визуализации данных в библиотеке matplotlib
  • Использование библиотеки Pandas для хранения и анализа данных
  • Использованеи библиотеки Statsmodels для статистического анализа данных
Элементы контроля

Элементы контроля

  • неблокирующий Работа на семинарах
  • блокирующий Самостоятельная работа
  • неблокирующий Итоговое тестирование
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 3 модуль
    0.2 * Итоговое тестирование + 0.3 * Работа на семинарах + 0.5 * Самостоятельная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019

Рекомендуемая дополнительная литература

  • Python и анализ данных, Маккинли, У., 2015