Магистратура
2021/2022
Современные методы анализа данных: машинное обучение
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Машинное обучение и высоконагруженные системы)
Направление:
01.04.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 2, 3 модуль
Формат изучения:
с онлайн-курсом
Охват аудитории:
для своего кампуса
Прогр. обучения:
Машинное обучение и высоконагруженные системы
Язык:
русский
Кредиты:
7
Контактные часы:
36
Программа дисциплины
Аннотация
Студенты узнают, как устроены решающие деревья и их композиции, узнают о некоторых методах кластеризации и снижения размерности, об основных подходах к решению задачи построения рекомендаций, а также получат первое представление о нейронных сетях.
Цель освоения дисциплины
- Умеет обучать и оценивать качество большинства классических моделей машинного обучения
- Умеет выбирать модель машинного обучения, исходя из особенностей задачи и данных
- Умеет ориентироваться в существующих метриках качества и выбирать метрику, исходя из задачи и особенностей данных
- Умеет решать как задачи обучения с учителем, так и задачи обучения без учителя
- Умеет решать задачу построения рекомендаций
- Умеет обучать полносвязную нейронную сеть в некоторых задачах
Планируемые результаты обучения
- выбирает модель машинного обучения, исходя из особенностей задачи и данных
- ориентируется в существующих метриках качества и выбирать метрику, исходя из задачи и особенностей данных
- решает задачу построения рекомендаций
- решает как задачи обучения с учителем, так и задачи обучения без учителя
- умеет оценивать качество большинства классических моделей машинного обучения
Содержание учебной дисциплины
- Решающие деревья, счётчики
- Бэггинг, разложение ошибки на шум-смещение-разброс
- Бустинг
- Практические штуки: блендинг, стекинг, методы измерения важности признаков (SHAP).
- Современные имплементации бустинга
- Методы кластеризации
- Методы снижения размерности
- Введение в нейронные сети
- Рекомендательные системы
Элементы контроля
- Домашнее задание
- Пятиминутки
- Проект
- Экзамен (письменный)Итог = Округление(0.15 * П + 0.3 * ДЗ + 0.4 * К + 0.15 * Э), где П - средняя оценка за пятиминутки - проверочные в начале каждого занятия, ДЗ - средняя оценка за домашние задания К - оценка за курсеру, Э - оценка за экзамен. Определим накопленную оценку как Накоп = Округление(0.15 * П + 0.3 * ДЗ + 0.4 * К) / 0.85. Если Накоп >= 7, то студент может получить Накоп в качестве итоговой оценки, не приходя на экзамен.