• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Современные методы анализа данных и машинного обучения

2023/2024
Учебный год
RUS
Обучение ведется на русском языке
7
Кредиты
Статус:
Курс обязательный
Когда читается:
3-й курс, 3, 4 модуль

Преподаватели

Программа дисциплины

Аннотация

Данный курс посвящен изучению основ анализа данных, построения визуализаций, применения продуктовых гипотез, аналитики данных, дата-инжиниринга, а также различных алгоритмов, применяемых при работе с данными и извлечении бизнес-выводов на основе них. В контексте курса делается упор на составляющую аналитики данных с подробным обсуждением специализированных библиотек для работы с данными и осуществления разведочного анализа данных, а также библиотек для применения классического и глубинного машинного обучения для реализации решаемых бизнес-задач.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство с языком программирования Python. Уверенное владение языком на базовом уровне для решения задач аналитики. Умение применять специальные библиотеки Numpy, Pandas для анализа бизнес-данных
  • Выработка навыков осуществления первичного анализа данных, построения визуализаций данных и их интерпретация
  • Знакомство с основными продуктовыми гипотезами, продуктовыми метриками. Умение их применять при решении бизнес-задач на практике
  • Ознакомление с принципами извлечения данных с внешних ресурсов и обработки полученных данных
  • Проработка математической основы использования машинного обучения, применение линейной алгебры и математического анализа для осуществления алгоритмов
  • Знакомство с машинным обучением в контексте задач классического машинного обучения без учителя
  • Знакомство с машинным обучением в контексте задач классического машинного обучения с учителем
  • Изучение принципов глубинного обучения и применения их на практике для решения бизнес-задач
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеть основами синтаксиса языка программирования Python
  • Уметь писать простые программы на языке программирования Python
  • Уметь применять специальные библиотеки Python для решения простых задач анализа данных
  • Владеть основами синтаксиса специальных библиотек для анализа данных: Numpy, Pandas
  • Владеть основами синтаксиса библиотек Matplotlib, Seaborn
  • Строить простейшие визуализации данных
  • Применять на практике основы EDA, осуществлять разведочный анализ данных
  • Работать с интерактивными визуализациями
  • Уметь вычислять и анализировать продуктовые метрики
  • Уметь строить и проверять продуктовые гипотезы
  • Осуществлять парсинг данных с внешних ресурсов
  • Работать с API внешних ресурсов
  • Уметь применять знания линейной алгебры в Python
  • Уметь применять знания математического анализа в Python
  • Использовать математический анализ и линейную алгебру для математического обоснования и оптимизации решений задач машинного обучения
  • Уметь применять машинное обучение для решения задач анализа данных
  • Дифференцировать методы машинного обучения по типам решаемых задач, метрикам качества, функциям ошибки, применять методы машинного обучения на практике
  • Решать задачи кластеризации на практике с использованием методов машинного обучения
  • Уметь применять нейронные сети для решения различных задач машинного обучения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в Python и библиотеки для анализа данных
  • Задачи анализа данных, аналитики, основы EDA
  • Продуктовые гипотезы, продуктовые метрики
  • Извлечение данных
  • Математика для машинного обучения
  • Классическое машинное обучение. Обучение с учителем
  • Классическое машинное обучение. Обучение без учителя
  • Основы глубинного обучения
Элементы контроля

Элементы контроля

  • неблокирующий ДЗ
    Средняя оценка за все практические домашние задания, предусмотренные на курсе
  • неблокирующий ГП
    Средняя оценка за все практические групповые инициативные проекты, предусмотренные на курсе
  • неблокирующий Активность
    Оценивание посещения и активности студента на семинарах, а также активности на лекциях
  • неблокирующий КР
    Контрольная работа представляет собой проверочный элемент контроля, выполняемый студентами по результатам освоения первой половины курса
  • неблокирующий Экзамен
    Экзамен представляет собой практическую работу, выполняемую студентами по результатам освоения курса
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 4th module
    0.14 * Активность + 0.12 * ГП + 0.28 * ДЗ + 0.14 * КР + 0.32 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Pandas for everyone : Python data analysis, Chen, D. Y., 2023
  • Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017
  • Python для data science, Васильев, Ю., 2023
  • Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018
  • Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019
  • Анализ социальных медиа на Python : извлекайте и анализируйте данные из всех уголков социальной паутины на Python, Бонцанини, М., 2018
  • Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
  • Дифференциальное исчисление и исследование функций многих переменных : Учебное пособие, Михайлова, И.Г., 2014
  • Когнитивная бизнес-аналитика : учеб. пособие для вузов, Абдикеев, Н. М., 2012
  • Линейная алгебра и функции многих переменных : учеб. пособие для физ. специальностей ун-тов, Булдырев, В. С., 1985
  • Нейронные сети. Полный курс : пер. с англ., Хайкин, С., 2018

Рекомендуемая дополнительная литература

  • Good charts : the HBR guide to making smarter, more persuasive data visualizations, Berinato, S., 2016
  • Visualizations and dashboards for learning analytics, , 2021
  • Бизнес-аналитика: от данных к знаниям : учеб. пособие, Паклин Н.Б., Орешков В.И., 2010
  • Большие данные в образовании: анализ данных как основание принятия управленческих решений : сб. науч. ст. I Международной конференции, 15 окт. 2020 г., Москва, , 2020
  • Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика, Усков, А. А., 2004
  • Искусственные нейронные сети : теория и практика, Круглов, В. В., 2002
  • Краткий курс математического анализа. Т.2: Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ, Кудрявцев, Л. Д., 2008
  • Машинное обучение : наука и искусство построения алгоритмов, которые извлекают знания из данных, Флах, П., 2015