• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Анализ данных на Python

Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Курс «Анализ данных в Python» направлен на формирование у студентов компетенций, необходимых для решения основных задач анализа экономических данных с применением современных инструментальных средств (язык программирования Python и его библиотеки). Курс включает в себя знакомство с основами применения Python для манипуляций с рядами и табличными данными, выявления закономерностей в данных, построения моделей машинного обучения и решения иных задач анализа данных и Data Science в целом.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Реализует сбор данных в сети с помощью парсинга или обращения к API.
  • уметь выполнять парсинг HTML c помощью bs4, уметь выполнять поиск по тэгам и атрибутам
  • Выполняет предварительную обработку данных (очистка, трансформация, устранение пропусков)
  • владеть навыками работы с базовыми структурами данных в Python
  • уметь создавать и обрабатывать массивы NumPy
  • уметь вычислять в Python описательные статистики и реализовывать статистические критерии для сравнения групп
  • уметь обрабатывать и преобразовывать датафреймы Pandas
  • уметь оценивать в Python модель линейной регрессии и интерпретировать результаты
  • уметь вычислять в Python коэффициент корреляции Пирсона и Спирмена, строить корреляционные матрицы
  • уметь оценивать в Python модель логистической регрессии и оценивать качество классификации
  • определять шкалы данных и выбирать подходящие для них способы визуализации, уметь строить различные виды графиков с помощью matplotlib и seaborn
  • уметь десериализовывать JSON в Python, уметь обрабатывать строки и файлы JSON с помощью pandas
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Индексируемые структуры данных
  • Массивы NumPy и операции на массивах
  • Неиндексируемые структуры данных
  • Датафреймы Pandas и операции на датафреймах
  • Очистка данных
  • Визуализация данных
  • Меры связи и линейная регрессия
  • Классификация и логистическая регрессия
  • Парсинг
  • API
Элементы контроля

Элементы контроля

  • неблокирующий Микроконтроль
  • неблокирующий Лабораторные работы
  • неблокирующий Проект
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    0.35 * Лабораторные работы + 0.15 * Микроконтроль + 0.5 * Проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
  • Груздев, А. В. Изучаем Pandas / А. В. Груздев, М. Хейдт , перевод с английского А. В. Груздева. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2019. — 700 с. — ISBN 978-5-97060-670-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131693 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Парсинг с помощью Python. Веб-скрапинг в действии. 3-е межд. изд. - 978-601-08-4570-1 - Митчелл Райан - 2025 - Астана: Спринт Бук - https://ibooks.ru/products/399818 - 399818 - iBOOKS
  • Тестирование веб-API. - 978-5-4461-2092-5 - Винтерингем Марк - 2024 - Санкт-Петербург: Питер - https://ibooks.ru/products/393785 - 393785 - iBOOKS

Рекомендуемая дополнительная литература

  • 33894 - Предварительная подготовка данных в Python. Том 2. План, примеры и метрики качества - А.Груздев - ДМК Пресс - 9785937001771 - 2023 - https://hse.alpinadigital.ru/document/33894 - Alpina
  • Груздев, А. В. Предварительная подготовка данных в Python / А. В. Груздев. — Москва : ДМК Пресс, 2023 — Том 1 : Инструменты и валидация — 2023. — 816 с. — ISBN 978-5-93700-156-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314945 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Карпович Марина Валерьевна
  • Назаровский Егор Борисович
  • Радыгина Анна Александровна
  • Сенина Анна Васильевна