• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Data Science

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 2, 3 модуль

Преподаватель


Бирюков Валентин Андреевич

Программа дисциплины

Аннотация

Программа предназначена для студентов первого года обучения в магистратуре по направлению 38.04.02 «Менеджмент» (программа «Экономика впечатлений: менеджмент в индустрии гостеприимства и туризме»). Дисциплина «Data Science» знакомит студентов с основными концепциями и методами анализа данных и машинного обучения. Студенты также научатся программировать на языке Python, познакомятся с базовыми приёмами извлечения и обработки данных из сети интернет и различных типов файлов. С использованием онлайн-курса "Основы программирования на Python" (URL: https://www.coursera.org/learn/python-osnovy-programmirovaniya).
Цель освоения дисциплины

Цель освоения дисциплины

  • Обучить студентов навыкам программирования на языках Python
  • Обучить студентов базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности.
  • Познакомить студентов с основными концепциями и методами анализа данных и машинного обучения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Визуализирует графики с использованием pyplot, отображает картографическую информацию с помощью API leaflet
  • Обрабатывает данные в формате json, работает с публичным интерфейсом API
  • Применяет логические выражения, условный оператор, оператор цикла while
  • Применяет словари, множества, методы работы с отдельными элементами и всеми структурами
  • Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
  • Решает задачи на ввод-вывод и целочисленную арифметику
  • Решает задачи на работу с вещественными числами, применяет функции работы со строками
  • Умеет работать с текстом, файлами csv, электронными таблицами xlsx и листами в них
  • Знает о применении DS в бизнес-кейсах, отличает и может описать использованные алгоритмы, методы и результаты.
  • Знает основные определения понятий науки о данных
  • Знает основы HTML, получает ресурсы по URLадресу, использует библиотеки для обработки HTML
  • Отличает основные типы графиков и область их применения
  • Умеет вывести и интерпретировать описательную статистику для выборки. Знает основные определения понятий.
  • Умеет использовать пакеты для построения регрессий. Может дать определение MAE, MAPE, MSE, R2.
  • Умеет отличать алгоритмы классификации. Понимает область применения алгоритмов классификации и их различие. Умеет считывать PR и ROC-кривые.
  • Умеет применять пакеты для работы с текстовыми данными. Умеет применять модель классификации, оценивать качество модели и интерпретировать полученные результаты.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Арифметика
  • Условный оператор, цикл while
  • Вещественные числа и строки
  • Цикл for, функции
  • Словари и множества
  • Обработка текстовых файлов и электронных таблиц
  • Обработка и создание HTML-страниц
  • json и API
  • Визуализация данных
  • Краткий курс нужной математики для Data Science
  • Введение. Что такое Data Science
  • Регрессия
  • Классификация: KNN, Алгоритм решающих деревьев
  • Анализ текстовых данных: подробное изучение бизнес-кейса с тональностью комментариев к отелям с Tripadvisor
  • Защита проектов с применением машинного обучения
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание (блок Python)
    Домашнее задание с Python проверяются автоматически с системой Яндекс.Контекст.
  • неблокирующий Домашнее задание (блок Аналитика)
    Домашнее задание по Аналитике включают в себя сдачу jupyter notebook с проведенным анализом показателей и статистическими выводами, а так же с тестовой частью.
  • неблокирующий Домашнее задание (блок Анализ данных)
    Домашние задания по Анализу данных включают в себя анализ данных с использованием языка python с применением моделей машинного обучения, а также с использованием методов краудсорсинга.
  • неблокирующий Проверочные работы
    Проверочные работы проводятся на парах в формате небольших блиц-тестов
  • неблокирующий Проектная работа
  • блокирующий Экзамен (письменный)
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 3 модуль
    0.2 * Проверочные работы + 0.2 * Проектная работа + 0.1 * Экзамен (письменный) + 0.25 * Домашнее задание (блок Анализ данных) + 0.15 * Домашнее задание (блок Аналитика) + 0.1 * Домашнее задание (блок Python)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • HEER, J., BOSTOCK, M., & OGIEVETSKY, V. (2010). A Tour Through the Visualization Zoo. Communications of the ACM, 53(6), 59–67. https://doi.org/10.1145/1743546.1743567
  • Linoff, G., & Berry, M. J. A. (2011). Data Mining Techniques : For Marketing, Sales, and Customer Relationship Management (Vol. 3rd ed). Indianapolis, Ind: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=520245
  • Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392
  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081

Рекомендуемая дополнительная литература

  • Д.Хафф - Как лгать при помощи статистики - Альпина Паблишер - 2015 - ISBN: 9785961439846 - Текст электронный // ЭБС Alpina - URL: https://hse.alpinadigital.ru/book/5573