Магистратура
2020/2021
Машинное обучение
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Интеллектуальный анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Золотых Николай Юрьевич
Прогр. обучения:
Интеллектуальный анализ данных
Язык:
русский
Кредиты:
4
Контактные часы:
60
Программа дисциплины
Аннотация
Курс посвящен изложению современных методов машинного обучения. Излагаются математические основы методов машинного обучения, основные алгоритмы, методы предобработки данных, основы теории машинного обучения. Практические задания выполняются с использованием библиотеки scikit-learn.
Цель освоения дисциплины
- Подготовка к профессиональной деятельности в области машинного обучения
- Развитие компетенций в области математических методов и информационных технологий.
Планируемые результаты обучения
- Освоение основных теоретических положений методов машинного обучения
- Овладение практическими навыками решения задач методами машинного обучения
- Освоение основных теоретических положений машинного обучения
Содержание учебной дисциплины
- Введение. Примеры практических задач• Содержательная постановка задачи машинного обучения. Связь с другими областями знания и практической деятельности. Основная терминология. Примеры практических задач обучения с учителем и без учителя. Обзор учебных материалов и ресурсов Интернет по тематике дисциплины
- Метод наименьших квадратовМетод наименьших квадратов для решения задачи восстановления регрессии. Проверка значимости и доверительные интервалы для коэффициентов (регрессионный анализ). Анализ остатков. Переобучение в задаче восстановления регрессии. Методы борьбы с переобуче-нием: выбор подмножества признаков; гребневая («ридж») регрессия (регуляризация); метод «лассо».
- Вероятностная постановка задачи обучения с учителемРегрессионная функция. Байесов классификатор. Принцип максимума апостериорной вероятности. Метод максимального правдоподобия. Наивный байесов классификатор. Метод ближайших соседей для задачи классификации и задачи восстановления регрессии. Теорема об оценке риска в методе ближайшего соседа
- Статистические методы решения задач классификацииДискриминантные и дескриптивные (описательные) методы в задаче классификации. Линейный и квадратичный дискриминантный анализ. Логистическая регрессия
- Нейронные сетиНейронная сеть. Универсальная теорема об аппроксимации (без доказательства). Алгоритм обратного распространения ошибки как градиентный метод. Борьба с переобучением с помощью регуляризации. Дропаут. Глубокое обучение. Сверточные слои, слои объединения.
- Деревья решенийМетод деревьев решений для решения задач машинного обучения. Алгоритм CART. Алгоритм С4.5. Отсечения.
- Ансамбли решающих правилКомбинирование слабых решающих правил. Баггинг. Случайные леса. Бустинг. Алгоритм AdaBoost. Алгоритм градиентного бустинга деревьев решений (gradient boosted trees).
- Задача обучения без учителяЗадача обучения без учителя. Методы средних и медиан для решения задачи кластеризации. Методы решения задач иерархической кластеризации. Алгоритм PageRank. Алгоритм Apriori.
- Метод опорных векторовОптимальная разделяющая гиперплоскость. Сведение метода к задаче квадратичного программирования. Ядра и спрямляющие пространства в методе «машина опорных векторов».
- 10. Элементы теории Вапника-ЧервоненкисаРазмерность Вапника–Червоненкиса. Теорема о равномерной сходимости эмпириче-ской ошибки к ожидаемому риску в случае конечной размерности Вапника–Червоненкиса
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.5 * Домашнее задание + 0.5 * Устный экзамен
Список литературы
Рекомендуемая основная литература
- Джеймс Г., Уиттон Д., Хасти Т. - Введение в статистическое обучение с примерами на языке R - Издательство "ДМК Пресс" - 2017 - 456с. - ISBN: 978-5-97060-495-3 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93580
Рекомендуемая дополнительная литература
- Флах П. - Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных - Издательство "ДМК Пресс" - 2015 - 400с. - ISBN: 978-5-97060-273-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/69955