Магистратура
2021/2022





Современные методы анализа данных
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс обязательный
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Где читается:
Школа информатики, физики и технологий
Когда читается:
1-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Суворова Алёна Владимировна
Прогр. обучения:
Информационные системы и взаимодействие человек-компьютер
Язык:
русский
Кредиты:
4
Контактные часы:
44
Программа дисциплины
Аннотация
Дисциплина направлена на изучение студентами основных принципов машинного обучения, эффективных алгоритмов обучения и применения обученных моделей. В результате изучения дисциплины у студента будет сформировано представление об основных задачах, решаемых с помощью моделей машинного обучения, как в области анализа пользователей информационных систем, так и при построение сервисов и приложений, основанных на данных.
Цель освоения дисциплины
- изучение основных принципов машинного обучения и построение моделей для решения задач автоматизации и анализа пользователей
Планируемые результаты обучения
- Выделяет подгруппы пользователей с помощью инструментов анализа данных
- Выделяет правила из данных методами машинного обучения
- Выявляет смещения (bias) в моделях
- Знает основные понятия машинного обучения
- Интерпретирует результаты предсказания
- Интерпретирует результаты статистического анализа с учетом ограничений использованных методов
- Обосновывает выбор методов и инструментария для проверки гипотез
- Применяет основные конструкции языка Python и библиотек для анализа данных
- Строит ансамблевые модели на языке Python
- Строит модели с применением методов интерпретируемого машинного обучения
- Строит предсказательные модели на языке Python
Содержание учебной дисциплины
- Введение, основные понятия анализа данных, инструментарий
- Выводы на основе данных: проверка гипотез и статистические тесты
- Сегментация данных
- Предсказания на основе данных. Классификация и регрессия
- Сложные модели и их применение.
Элементы контроля
- Дневники проектаЗа сдачу после дедлайна начисляется 5% штраф за каждый день просрочки
- ПроектЗа сдачу после дедлайна начисляется 5% штраф за каждый день просрочки
- Экзамен
- ЭссеДомашнее задание представляет собой структурированное эссе по одной из статей, связанных с методологией или применением A/B тестирования. Статья выбирается из предложенного преподавателем списка или самостоятельно студентом по согласованию с преподавателем.
- Упражнения
Промежуточная аттестация
- 2021/2022 учебный год 2 модуль0.15 * Эссе + 0.25 * Дневники проекта + 0.2 * Экзамен + 0.1 * Упражнения + 0.3 * Проект
Список литературы
Рекомендуемая основная литература
- James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
- Trevor Hastie, Robert Tibshirani , et al., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd edition, 2017. Free from the publisher: https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12.pdf
- Вьюгин, В. В. Математические основы машинного обучения и прогнозирования : учебное пособие / В. В. Вьюгин. — Москва : МЦНМО, 2014. — 304 с. — ISBN 978-5-4439-2014-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/56397 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Ahmed, S. E. (2017). Big and Complex Data Analysis : Methodologies and Applications. Cham, Switzerland: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1383914
- Explainable and interpretable models in computer vision and machine learning. (2018). https://doi.org/10.1007/978-3-319-98131-4
- Molnar, C. (2018). iml: An R package for Interpretable Machine Learning. https://doi.org/10.5281/zenodo.1299058
- Provost, F., & Fawcett, T. (2013). Data Science for Business : What You Need to Know About Data Mining and Data-Analytic Thinking (Vol. 1st ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619895