Бакалавриат
2025/2026




Аналитика данных на Python
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Международная программа по бизнесу и экономике)
Где читается:
Санкт-Петербургская школа экономики и менеджмента
Когда читается:
3-й курс, 3 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
4
Контактные часы:
32
Программа дисциплины
Аннотация
Python – это интерпретируемый высокоуровневый язык программирования общего назначения. Этот язык удобно применять для сбора, обработки и визуализации данных. Этот одномодульный курс представляет собой расширение функционала языка программирования Python. Среднее время прохождения курса зависит от подготовки студента. Для прохождения курса студенты должны обладать математическими навыками на уровне средней школы. Успеваемость студентов оценивается с помощью заданий по программированию: классных работ и итогового проекта. Примеры и задачи, используемые в курсе, охватывают такие области, как парсинг сайтов и файлов, визуализация данных, машинное обучение на Python. Лекции по данному курсу не читаются, весь теоретический материал дается на семинарах.
Цель освоения дисциплины
- ● использование Python для сбора данных с сайтов и из файлов ● умение строить информативные визуализации на Python ● знакомство с основами машинного обучения с использованием синтаксиса Python
Планируемые результаты обучения
- студенты понимают детали применения парсинга для сбора данных с сайтов и умеют создавать код для его применения
- студенты умеют применять библиотеки Python для использования дополнительного функционала
- студенты способны применять базовые знания Python и совмещать их с новым материалом
Содержание учебной дисциплины
- 1. Способы хранения информации: Pandas, JSON, Pickle
- 2. Парсинг по API, requests
- 3. Скрэйпинг: re, bs4
- 4. Парсинг файлов
- 5. Описательные статистики; очистка данных; визуализация
- 6. Линейная регрессия (statsmodels, scikit)
- 7. Машинное обучение, деревья решений
Элементы контроля
- Семинарские задания■ Выдается каждую неделю на соответствующих семинарах. На выполнение задания дается 1 неделя. ■ Реализовано с помощью платформы Smart LMS, среды moodle sandbox. ■ Оценка публикуется не позднее чем через 5 рабочих дней после окончания срока сдачи.
- Итоговый проект■ Экзамен не является блокирующим. ■ Экзамен охватывает все темы из учебной программы. ■ Экзамен проводится в форме защиты проекта. ■ Проект готовится и защищается группой из 3-4 человек. ■ Продолжительность - 10 минут на защиту для группы, 5 минут на вопросы преподавателей для группы. Проект не должен содержать плагиат, в противном случае за экзамен выставляется оценка 0.
Список литературы
Рекомендуемая основная литература
- Паршинцева, Л. С., Многомерный анализ данных на Python : учебник / Л. С. Паршинцева, А. А. Паршинцев. — Москва : КноРус, 2024. — 129 с. — ISBN 978-5-406-12606-6. — URL: https://book.ru/book/951954 (дата обращения: 09.12.2025). — Текст : электронный.
Рекомендуемая дополнительная литература
- Жуков Р.А. - Язык программирования Python. Практикум - 978-5-16-015638-5 - ИНФРА-М - 2024 - https://znanium.ru/catalog/product/2131861 - 2131861 - ZNANIUM