2022/2023
Статистический анализ в Python
Статус:
Дисциплина общефакультетского пула
Кто читает:
Департамент прикладной математики
Когда читается:
3 модуль
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Поляков Константин Львович
Язык:
русский
Кредиты:
4
Контактные часы:
40
Программа дисциплины
Аннотация
Курс "Статистический анализ в Python" ориентирован на студентов, образование которых связано с анализом данных и/или они планируют использовать анализ данных в своей будущей профессиональной деятельности. Свободно распространяемая платформа CPython и различные проекты, основанные на ней (библиотеки) предоставляют богатые возможности для анализа данных без увеличения стоимости образования и/или коммерческих проектов. В рамках курса студенты познакомяться с вычислительными возможностями платформы и наиболее значимых библиотек, приобретут навыки самостоятельного использования языка Python и различных прикладных библиотек для проведения статистчиеского анализа данных и создания проблемно ориентированных приложений.
Цель освоения дисциплины
- Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных с управлением данными— организацией сбора и хранения данных, выбором данных по определенным критериям, содержащим несколько условий, модификацией данных, обменом данными между различными приложениями, интеграцией данных, полученных из различных источников.
- Целью курса является развитие у слушателей навыков разведочного анализа данных с использованием языка Python и стека созданных для него библиотек, образующих платформу для анализа данных.
- Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных с элементарным анализом данных — числовым анализом: подсчетом описательных числовых статистик адекватных типу данных, графическим анализом: визуализацией статистических свойств данных.
- Формирование у студентов навыков самостоятельной реализации элементарных проектов, связанных со статистическим анализом данных.
Планируемые результаты обучения
- Знать основные функции системной библиотеки Python 3 (текущая версия).
- Знать структуру (основные разделы) библиотеки matplotlib (текущая версия).
- Знать структуру (основные разделы) библиотеки NumPy(текущая версия).
- Знать структуру (основные разделы) библиотеки Pandas(текущая версия).
- Знать грамматику языка Python 3 (текущая версия) и стандарты разработки приложений на языке Python 3 (текущая версия).
- Уметь использовать библиотеку NumPy (текущая версия) для организации предварительного анализа данных.
- Уметь использовать библиотеку NumPy (текущая версия) для организации хранения данных и управления данными.
- Уметь использовать библиотеку Pandas для предварительного анализа данных.
- Учесть использовать библиотеку matplotlib для графического анализа данных
Содержание учебной дисциплины
- Основы языка Python
- Аналитические возможности библиотеки NumPy
- Основы визуализации данных в библиотеке matplotlib
- Использование библиотеки Pandas для хранения и анализа данных
- Использованеи библиотеки Statsmodels для статистического анализа данных
Элементы контроля
- Работа на семинарах
- Самостоятельная работаПроект выполняется в соответствии с техническим заданием, которое выдается в начале обучения. Оценка проставляется по десятибалльной шкале.
- Итоговое тестирование
Промежуточная аттестация
- 2022/2023 учебный год 3 модуль0.3 * Работа на семинарах + 0.2 * Итоговое тестирование + 0.5 * Самостоятельная работа