• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2025/2026

Аналитика данных на Python

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Новизна полученных знаний»
Когда читается: 3-й курс, 3 модуль
Охват аудитории: для своего кампуса
Преподаватели: Ефимов Константин Дмитриевич, Омеляш Ксения Васильевна, Юртаева Яна Николаевна
Язык: русский
Кредиты: 4
Контактные часы: 32

Программа дисциплины

Аннотация

Python – это интерпретируемый высокоуровневый язык программирования общего назначения. Этот язык удобно применять для сбора, обработки и визуализации данных. Этот одномодульный курс представляет собой расширение функционала языка программирования Python. Среднее время прохождения курса зависит от подготовки студента. Для прохождения курса студенты должны обладать математическими навыками на уровне средней школы. Успеваемость студентов оценивается с помощью заданий по программированию: классных работ и итогового проекта. Примеры и задачи, используемые в курсе, охватывают такие области, как парсинг сайтов и файлов, визуализация данных, машинное обучение на Python. Лекции по данному курсу не читаются, весь теоретический материал дается на семинарах.
Цель освоения дисциплины

Цель освоения дисциплины

  • ● использование Python для сбора данных с сайтов и из файлов ● умение строить информативные визуализации на Python ● знакомство с основами машинного обучения с использованием синтаксиса Python
Планируемые результаты обучения

Планируемые результаты обучения

  • студенты понимают детали применения парсинга для сбора данных с сайтов и умеют создавать код для его применения
  • студенты умеют применять библиотеки Python для использования дополнительного функционала
  • студенты способны применять базовые знания Python и совмещать их с новым материалом
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Способы хранения информации: Pandas, JSON, Pickle
  • 2. Парсинг по API, requests
  • 3. Скрэйпинг: re, bs4
  • 4. Парсинг файлов
  • 5. Описательные статистики; очистка данных; визуализация
  • 6. Линейная регрессия (statsmodels, scikit)
  • 7. Машинное обучение, деревья решений
Элементы контроля

Элементы контроля

  • неблокирующий Семинарские задания
    ■ Выдается каждую неделю на соответствующих семинарах. На выполнение задания дается 1 неделя. ■ Реализовано с помощью платформы Smart LMS, среды moodle sandbox. ■ Оценка публикуется не позднее чем через 5 рабочих дней после окончания срока сдачи.
  • неблокирующий Итоговый проект
    ■ Экзамен не является блокирующим. ■ Экзамен охватывает все темы из учебной программы. ■ Экзамен проводится в форме защиты проекта. ■ Проект готовится и защищается группой из 3-4 человек. ■ Продолжительность - 10 минут на защиту для группы, 5 минут на вопросы преподавателей для группы. Проект не должен содержать плагиат, в противном случае за экзамен выставляется оценка 0.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 3rd module
    0.4 * Семинарские задания + 0.6 * Итоговый проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Паршинцева, Л. С., Многомерный анализ данных на Python : учебник / Л. С. Паршинцева, А. А. Паршинцев. — Москва : КноРус, 2024. — 129 с. — ISBN 978-5-406-12606-6. — URL: https://book.ru/book/951954 (дата обращения: 09.12.2025). — Текст : электронный.

Рекомендуемая дополнительная литература

  • Жуков Р.А. - Язык программирования Python. Практикум - 978-5-16-015638-5 - ИНФРА-М - 2024 - https://znanium.ru/catalog/product/2131861 - 2131861 - ZNANIUM

Авторы

  • Ефимов Константин Дмитриевич
  • Орлова Екатерина Дмитриевна