Магистратура
2021/2022
Data Science
Статус:
Курс обязательный (Экономика впечатлений: менеджмент в индустрии гостеприимства и туризме)
Направление:
38.04.02. Менеджмент
Кто читает:
Департамент маркетинга
Где читается:
Высшая школа бизнеса
Когда читается:
1-й курс, 2, 3 модуль
Формат изучения:
с онлайн-курсом
Охват аудитории:
для своего кампуса
Преподаватели:
Бирюков Валентин Андреевич
Прогр. обучения:
Экономика впечатлений: менеджмент в индустрии гостеприимства и туризме
Язык:
русский
Кредиты:
5
Контактные часы:
34
Программа дисциплины
Аннотация
Программа предназначена для студентов первого года обучения в магистратуре по направлению 38.04.02 «Менеджмент» (программа «Экономика впечатлений: менеджмент в индустрии гостеприимства и туризме»). Дисциплина «Data Science» знакомит студентов с основными концепциями и методами анализа данных и машинного обучения. Студенты также научатся программировать на языке Python, познакомятся с базовыми приёмами извлечения и обработки данных из сети интернет и различных типов файлов. С использованием онлайн-курса "Основы программирования на Python" (URL: https://www.coursera.org/learn/python-osnovy-programmirovaniya).
Цель освоения дисциплины
- Обучить студентов навыкам программирования на языках Python
- Обучить студентов базовым приёмам извлечения данных из сети интернет и различных типов файлов, и их обработки, необходимым для дальнейшего обучения и в работе по специальности.
- Познакомить студентов с основными концепциями и методами анализа данных и машинного обучения.
Планируемые результаты обучения
- Визуализирует графики с использованием pyplot, отображает картографическую информацию с помощью API leaflet
- Обрабатывает данные в формате json, работает с публичным интерфейсом API
- Применяет логические выражения, условный оператор, оператор цикла while
- Применяет словари, множества, методы работы с отдельными элементами и всеми структурами
- Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
- Решает задачи на ввод-вывод и целочисленную арифметику
- Решает задачи на работу с вещественными числами, применяет функции работы со строками
- Умеет работать с текстом, файлами csv, электронными таблицами xlsx и листами в них
- Знает о применении DS в бизнес-кейсах, отличает и может описать использованные алгоритмы, методы и результаты.
- Знает основные определения понятий науки о данных
- Знает основы HTML, получает ресурсы по URLадресу, использует библиотеки для обработки HTML
- Отличает основные типы графиков и область их применения
- Умеет вывести и интерпретировать описательную статистику для выборки. Знает основные определения понятий.
- Умеет использовать пакеты для построения регрессий. Может дать определение MAE, MAPE, MSE, R2.
- Умеет отличать алгоритмы классификации. Понимает область применения алгоритмов классификации и их различие. Умеет считывать PR и ROC-кривые.
- Умеет применять пакеты для работы с текстовыми данными. Умеет применять модель классификации, оценивать качество модели и интерпретировать полученные результаты.
Содержание учебной дисциплины
- Арифметика
- Условный оператор, цикл while
- Вещественные числа и строки
- Цикл for, функции
- Словари и множества
- Обработка текстовых файлов и электронных таблиц
- Обработка и создание HTML-страниц
- json и API
- Визуализация данных
- Краткий курс нужной математики для Data Science
- Введение. Что такое Data Science
- Регрессия
- Классификация: KNN, Алгоритм решающих деревьев
- Анализ текстовых данных: подробное изучение бизнес-кейса с тональностью комментариев к отелям с Tripadvisor
- Защита проектов с применением машинного обучения
Элементы контроля
- Домашнее задание (блок Python)Домашнее задание с Python проверяются автоматически с системой Яндекс.Контекст.
- Домашнее задание (блок Аналитика)Домашнее задание по Аналитике включают в себя сдачу jupyter notebook с проведенным анализом показателей и статистическими выводами, а так же с тестовой частью.
- Домашнее задание (блок Анализ данных)Домашние задания по Анализу данных включают в себя анализ данных с использованием языка python с применением моделей машинного обучения, а также с использованием методов краудсорсинга.
- Проверочные работыПроверочные работы проводятся на парах в формате небольших блиц-тестов
- Проектная работа
- Экзамен (письменный)
Промежуточная аттестация
- 2021/2022 учебный год 3 модуль0.2 * Проверочные работы + 0.2 * Проектная работа + 0.1 * Экзамен (письменный) + 0.25 * Домашнее задание (блок Анализ данных) + 0.15 * Домашнее задание (блок Аналитика) + 0.1 * Домашнее задание (блок Python)
Список литературы
Рекомендуемая основная литература
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- HEER, J., BOSTOCK, M., & OGIEVETSKY, V. (2010). A Tour Through the Visualization Zoo. Communications of the ACM, 53(6), 59–67. https://doi.org/10.1145/1743546.1743567
- Linoff, G., & Berry, M. J. A. (2011). Data Mining Techniques : For Marketing, Sales, and Customer Relationship Management (Vol. 3rd ed). Indianapolis, Ind: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=520245
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392
- Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081
Рекомендуемая дополнительная литература
- Д.Хафф - Как лгать при помощи статистики - Альпина Паблишер - 2015 - ISBN: 9785961439846 - Текст электронный // ЭБС Alpina - URL: https://hse.alpinadigital.ru/book/5573