• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Python for Data Science

2022/2023
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Compulsory course
When:
2 year, 3, 4 module

Instructor

Программа дисциплины

Аннотация

На сегодняшний день Python является стандартом индустрии для анализа данных. По окончании этого курса, студенты получат в свое распоряжение набор аналитических инструментов, которые им пригодятся как в академии, так и при работе в частном или государственном секторе. Целью этого курса является развитие навыков программирования и создание крепкой практической базы для анализа и презентации данных. С использованием онлайн-курса "Python для извлечения и обработки данных" (URL: https://www.coursera.org/learn/python-kak-inostrannyj).
Цель освоения дисциплины

Цель освоения дисциплины

  • Развитие и закрепление навыков программирования на языке Python.
  • Формирование и развитие навыков работы со специализированными библиотеками для обработки, визуализации и анализа данных (pandas, numpy, plotly, matplotlib, seaborn).
  • Развитие навыков работы с данными: обработка, визуализация, разведывательный анализ.
  • Знакомство с задачами линейной и логистической регрессии
  • Развитие навыков постановки исследовательской задачи и тестирования гипотез с помощью количественных методов
Планируемые результаты обучения

Планируемые результаты обучения

  • Выбирает корректные графики для визуализации данных
  • Выбирает правильный тип визуализации для решения конкретной задачи
  • Загружает данные в pandas и работает с ними (фильтрация, агрегация, заполнение пропущенных значений)
  • Настраивает внешний вид графиков в библиотеках Python для визуализации
  • Определяет тип задачи регрессии, умеет составлять уравнение регрессии
  • Подсчитывает описательные статистики, оценивает распределения, интерпретирует корреляции
  • Проводит разведывательный анализ данных
  • Проводит разведывательный анализ данных с помощью визуализаций
  • Разбирается в выборе линейной модели для обучения, используя библиотеки Python
  • Уверенно пользуется языком Python для решения аналитических задач
  • Умеет подсчитывать и интерпретировать метрики качества для задачи регрессии
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы программирования в Python
  • Введение в анализ данных на Python
  • Визуализация данных
  • Линейная/логистическая регрессия
Элементы контроля

Элементы контроля

  • неблокирующий СР
  • неблокирующий Активность
  • неблокирующий ДЗ1
  • неблокирующий ДЗ2
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.25 * ДЗ1 + 0.2 * Активность + 0.3 * СР + 0.25 * ДЗ2
Список литературы

Список литературы

Рекомендуемая основная литература

  • Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)

Рекомендуемая дополнительная литература

  • Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.
  • Miroslav Kubat. An Introduction to Machine Learning. Springer, 2015 (296 pages) ISBN: 9783319200095: — Текст электронны // ЭБС books24x7 — https://library.books24x7.com/toc.aspx?bookid=117295
  • Мастицкий, С. Э. Визуализация данных с помощью ggplot2 / С. Э. Мастицкий. — Москва : ДМК Пресс, 2017. — 222 с. — ISBN 978-5-97060-470-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/107895 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2019. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/970143
  • Северенс, Ч. Введение в программирование на Python : учебное пособие / Ч. Северенс. — 2-е изд. — Москва : ИНТУИТ, 2016. — 231 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100703 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.