Бакалавриат
2019/2020
Введение в машинное обучение
Статус:
Курс по выбору (Бизнес-информатика)
Направление:
38.03.05. Бизнес-информатика
Где читается:
Факультет экономики, менеджмента и бизнес-информатики
Когда читается:
3-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Язык:
русский
Кредиты:
6
Контактные часы:
58
Программа дисциплины
Аннотация
Настоящая программа учебной дисциплины устанавливает требования к образовательным результатам и результатам обучения студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих дисциплину «Введение в машинное обучение», учебных ассистентов и студентов направления подготовки 38.03.05 Бизнес-информатика, обучающихся по образовательной программе «Бизнес информатика».
Цель освоения дисциплины
- приобретение навыков работы на языке Python, знание и понимание задач управления данными, в том числе, загрузка данных, преобразование данных, и предварительный анализ и визуализация данных
- знакомство с основными задачами и моделями машинного обучения, знание методов оценки качества работы различных моделей машинного обучения
- понимание процесса интеграции моделей машинного обучения в рамках задач стоящих перед потенциальными заказчиками
- повышение мотивации студентов на дальнейшее углубление своих знаний в области работы с данными и машинного обучения
Планируемые результаты обучения
- Знает основные стадии ведения проекта машинного обучения; умеет распозанавать задачи машинного обучения в реальных бизнес-задачах; имеет навыки оценки качества и интерпретации полученных результатов
- Знает основные подходы к преобразованию данных; умеет работать с массивами данных; имеет навыки загрузки, преобразования, очистки и визуализизации данных на языке Python
- Знает основные задачи машинного обучени; знает основные модели машинного обучения; умеет формализовать бизнес задачу как задачу машинного обучения; имеет навыки обучения и применения моделей машинного обучения на языке Python
Содержание учебной дисциплины
- Раздел 1. Введение в анализ данных и язык PythonТема 1. Введение в анализ данных Тема 2. Введение в язык Python Тема 3. Основные операции работы с данными Тема 4. Визуализация данных
- Раздел 2. Фундаментальные основы машинного обученияТема 5. Статистика и машинное обучение Тема 6. Задачи классификации и регрессии. Линейные и древесные модели Тема 7. Бэггинг и бустинг Тема 8. Задача кластеризации
- Раздел 3. Прикладной опыт ведения проектов машинного обученияТема 9. Разработка и создание аналитических приложений Тема 10. Внедрение, сопровождение и мониторинг модели Тема 11. Экспертиза качества моделей
Элементы контроля
- Лабораторная работа 1
- Лабораторная работа 2
- Лабораторная работа 3
- Выполнение проекта (самостоятельная работа)
- ЭкзаменЭкзамен проводится с использованием асинхронного прокторинга. Требования к ПК пользователя: 1. Стационарный компьютер или ноутбук (мобильные устройства не поддерживаются); 2. Операционная система Windows (версии 7, 8, 8.1, 10) или Mac OS X Yosemite 10.10 и выше; 3. Интернет-браузер Google Chrome последней на момент сдачи экзамена версии: (для установки браузера используйте ссылку https://www.google.com/chrome/, для проверки и обновления версии браузера используйте ссылку chrome://help/, при переходе можно увидеть номер версии своего браузера и кнопку для обновления, если они доступны); 4. Наличие постоянного интернет-соединения со скоростью передачи данных от пользователя не ниже 5 Мбит/сек.; 5. Разрешена передача данных по сетевым портам: 80 TCP, 443 TCP, 3478 TCP/UDP (уточнить этот вопрос у провайдера/открыть панель управления - система и безопасность - брандмауэр защитника Windows- дополнительные параметры. Убедитесь, что нет ограничений на входящее и исходящее соединение); 6. Наличие исправной и включенной веб-камеры (включая встроенные в ноутбуки); 7. Наличие исправного и включенного микрофона (включая встроенные в ноутбуки). https://elearning.hse.ru/data/2020/04/23/1559799268/Инструкция%20по%20работе%20в%20системе%20прокторинга%20Экзамус%202020.%20Асинхрон.pdf
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.3 * Выполнение проекта (самостоятельная работа) + 0.1 * Лабораторная работа 1 + 0.1 * Лабораторная работа 2 + 0.1 * Лабораторная работа 3 + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Компьютерные технологии анализа данных в эконометрике / Д.М. Дайитбегов. - М.: ИНФРА-М: Вузовский учебник, 2008. - 578 с.: 70x100 1/16. - (Научная книга). (переплет) ISBN 978-5-16-003380-8 - Режим доступа: http://znanium.com/catalog/product/143137
- Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2018. — 343 с. — (Высшее образование: Бакалавриат). - Режим доступа: http://znanium.com/catalog/product/924699
- Под ред. Мхитаряна В.С. - АНАЛИЗ ДАННЫХ. Учебник для академического бакалавриата - М.:Издательство Юрайт - 2019 - 490с. - ISBN: 978-5-534-00616-2 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/analiz-dannyh-432178
Рекомендуемая дополнительная литература
- Экономическая информатика: Введение в экономический анализ информационных систем [Электронный ресурс] : Учебник. - M.: Инфра-М, 2005. - 965 с.: - (Учебники экономического факультета МГУ им. М.В. Ломоносова). - ISBN 5-16-002009-8. - Режим доступа: http://znanium.com/catalog/product/534301