Бакалавриат
2025/2026




Анализ данных на Python
Статус:
Курс обязательный (Разработка информационных систем для бизнеса)
Где читается:
Факультет социально-экономических и компьютерных наук
Когда читается:
2-й курс, 4 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Курс «Анализ данных в Python» направлен на формирование у студентов компетенций, необходимых для решения основных задач анализа экономических данных с применением современных инструментальных средств (язык программирования Python и его библиотеки). Курс включает в себя знакомство с основами применения Python для манипуляций с рядами и табличными данными, выявления закономерностей в данных, построения моделей машинного обучения и решения иных задач анализа данных и Data Science в целом.
Цель освоения дисциплины
- Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения
- Реализует сбор данных в сети с помощью парсинга или обращения к API.
- уметь выполнять парсинг HTML c помощью bs4, уметь выполнять поиск по тэгам и атрибутам
- Выполняет предварительную обработку данных (очистка, трансформация, устранение пропусков)
- владеть навыками работы с базовыми структурами данных в Python
- уметь создавать и обрабатывать массивы NumPy
- уметь вычислять в Python описательные статистики и реализовывать статистические критерии для сравнения групп
- уметь обрабатывать и преобразовывать датафреймы Pandas
- уметь оценивать в Python модель линейной регрессии и интерпретировать результаты
- уметь вычислять в Python коэффициент корреляции Пирсона и Спирмена, строить корреляционные матрицы
- уметь оценивать в Python модель логистической регрессии и оценивать качество классификации
- определять шкалы данных и выбирать подходящие для них способы визуализации, уметь строить различные виды графиков с помощью matplotlib и seaborn
- уметь десериализовывать JSON в Python, уметь обрабатывать строки и файлы JSON с помощью pandas
Содержание учебной дисциплины
- Индексируемые структуры данных
- Массивы NumPy и операции на массивах
- Неиндексируемые структуры данных
- Датафреймы Pandas и операции на датафреймах
- Очистка данных
- Визуализация данных
- Меры связи и линейная регрессия
- Классификация и логистическая регрессия
- Парсинг
- API
Промежуточная аттестация
- 2025/2026 4th module0.35 * Лабораторные работы + 0.15 * Микроконтроль + 0.5 * Проект
Список литературы
Рекомендуемая основная литература
- McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
- Груздев, А. В. Изучаем Pandas / А. В. Груздев, М. Хейдт , перевод с английского А. В. Груздева. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2019. — 700 с. — ISBN 978-5-97060-670-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131693 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Парсинг с помощью Python. Веб-скрапинг в действии. 3-е межд. изд. - 978-601-08-4570-1 - Митчелл Райан - 2025 - Астана: Спринт Бук - https://ibooks.ru/products/399818 - 399818 - iBOOKS
- Тестирование веб-API. - 978-5-4461-2092-5 - Винтерингем Марк - 2024 - Санкт-Петербург: Питер - https://ibooks.ru/products/393785 - 393785 - iBOOKS
Рекомендуемая дополнительная литература
- 33894 - Предварительная подготовка данных в Python. Том 2. План, примеры и метрики качества - А.Груздев - ДМК Пресс - 9785937001771 - 2023 - https://hse.alpinadigital.ru/document/33894 - Alpina
- Груздев, А. В. Предварительная подготовка данных в Python / А. В. Груздев. — Москва : ДМК Пресс, 2023 — Том 1 : Инструменты и валидация — 2023. — 816 с. — ISBN 978-5-93700-156-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314945 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.