2021/2022
Интеллектуальный анализ данных и основы машинного обучения
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Майнор
Кто читает:
Департамент математики
Когда читается:
1, 2 модуль
Преподаватели:
Захарова Виктория Владиславовна,
Попов Александр Денисович,
Сироткин Александр Владимирович,
Суворова Алёна Владимировна,
Чуприна Дарья Викторовна
Язык:
русский
Кредиты:
5
Контактные часы:
52
Программа дисциплины
Аннотация
Данный курс посвящен развитию и закреплению навыков, полученных в двух предыдущих курсах майнора. В первой части курса акцент сделан на знакомстве с основными понятиями и алгоритмами машинного обучения, а также соответствующими математическими моделями. Вторая часть курса позволяет более детально погрузиться в одну из выбранных областей. Курс ориентирован на формирование у студентов способности строить собственные модели, ориентированные на конкретные имеющиеся данные, и обзорное знакомство с очень широким спектром методов. В результате освоения курса студенты будут способны самостоятельно разбираться в существующих методах, а так же самостоятельно осваивать методы и модели, не разбиравшиеся подробно в курсах, но необходимые для обработки конкретных специфических данных.
Цель освоения дисциплины
- Целями освоения дисциплины «Интеллектуальный анализ данных и основы машинного обучения» являются освоение основных понятий и методов машинного обучения, развитие навыков программирования для решения задач предсказания на языке R, а также углубление навыков работы с данными в специфических областях, включая клиентскую аналитику и визуализацию.
Планируемые результаты обучения
- визуализирует результаты анализа специализированных данных
- знает основные понятия машинного обучения
- интерпретирует результаты моделей машинного обучения
- оценивает качество моделей машинного обучения
- преобразовывает описание задачи в формулировку в терминах задачи построения модели регрессии или классификации
- разрабатывает модели для решения задач клиентской аналитики
- разрабатывает модели на языке R для решения задач предсказания
- решает задачи кластеризации на языке R
Содержание учебной дисциплины
- Основные понятия машинного обучения
- Задачи классификации и регрессии
- Ансамбли моделей и интерпретация
- Обучение без учителя
- Интеллектуальный анализ данных
Элементы контроля
- Контрольная работа
- Упражнения
- Домашнее задание
- ПроектФорма итогового программного проекта отличается для разных треков. Данные для задания предоставляются преподавателем. Работа выполняется индивидуально. Проект должен содержать все необходимые пояснения и интерпретации. Трек 1. Проект предполагает построение дэшборда и отчета с пояснениями и обоснованием выбора элементов дэшборда для задачи клиентской аналитики и предсказания оттока клиентов. Итоговый отчет содержит следующие разделы: 1) формулировка решаемой задачи, 2) описание методов решения поставленной задачи, 3) полученные результаты и выводы, 4) обоснование включенных в дэшборд элементов (как они помогают представить полученные результаты). Трек 2. Проект предполагает построение предсказательной модели в формате соревнования по машинному обучению и составление отчета с пояснениями по построенной модели. Итоговый отчет содержит следующие разделы: 1) предварительное исследование данных, 2) описание используемых для предсказания признаков и способы их формирования, 3) как минимум две предсказательные модели и обоснование выбора итоговой модели, 4) описание результатов в соревновании. Трек 3. Проект предполагает составление аналитического отчета по выбранной тематике (в контексте сетей и текстов) и оформление результатов работы в формате блог-поста с визуализациями. Итоговый отчет содержит следующие разделы: 1) описание поставленной задачи, 2) предварительное исследование данных, 3) описание использованных методов, 4) описание полученных результатов.
- Контрольная работа
- Упражнения
- Домашнее задание
- ПроектФорма итогового программного проекта отличается для разных треков. Данные для задания предоставляются преподавателем. Работа выполняется индивидуально. Проект должен содержать все необходимые пояснения и интерпретации. Трек 1. Проект предполагает построение дэшборда и отчета с пояснениями и обоснованием выбора элементов дэшборда для задачи клиентской аналитики и предсказания оттока клиентов. Итоговый отчет содержит следующие разделы: 1) формулировка решаемой задачи, 2) описание методов решения поставленной задачи, 3) полученные результаты и выводы, 4) обоснование включенных в дэшборд элементов (как они помогают представить полученные результаты). Трек 2. Проект предполагает построение предсказательной модели в формате соревнования по машинному обучению и составление отчета с пояснениями по построенной модели. Итоговый отчет содержит следующие разделы: 1) предварительное исследование данных, 2) описание используемых для предсказания признаков и способы их формирования, 3) как минимум две предсказательные модели и обоснование выбора итоговой модели, 4) описание результатов в соревновании. Трек 3. Проект предполагает составление аналитического отчета по выбранной тематике (в контексте сетей и текстов) и оформление результатов работы в формате блог-поста с визуализациями. Итоговый отчет содержит следующие разделы: 1) описание поставленной задачи, 2) предварительное исследование данных, 3) описание использованных методов, 4) описание полученных результатов.
Промежуточная аттестация
- 2021/2022 учебный год 2 модуль0.15 * Упражнения + 0.4 * Проект + 0.2 * Домашнее задание + 0.25 * Контрольная работа
Список литературы
Рекомендуемая основная литература
- James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
- Под ред. Мхитаряна В.С. - АНАЛИЗ ДАННЫХ. Учебник для академического бакалавриата - М.:Издательство Юрайт - 2019 - 490с. - ISBN: 978-5-534-00616-2 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/analiz-dannyh-432178
Рекомендуемая дополнительная литература
- Siegel, E. Predictive analytics: The power to predict who will click, buy, lie, or die. – John Wiley & Sons, 2016. – 338 pp.
- Zhao, Y., & Cen, Y. (2013). Data Mining Applications with R. Amsterdam: Academic Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=543675