• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2022/2023

Введение в машинное обучение

Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Бизнес-информатика)
Направление: 38.03.05. Бизнес-информатика
Когда читается: 3-й курс, 3, 4 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 60
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Беляков Денис Олегович, Васильев Роман Александрович, Нарцев Андрей Дмитриевич, Полунина Полина Алексеевна, Попов Михаил Андреевич
Язык: русский
Кредиты: 3
Контактные часы: 24

Программа дисциплины

Аннотация

Курс посвящён изучению основных методов машинного обучения. Изучаемые темы можно разбить на три блока. Первый — работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Второй блок — обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Третий блок — обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных. По итогам курса слушатель сможет сформулировать задачу машинного обучения, выбрать метрику качества, обучить модель, подобрать гиперпараметры, провести валидацию.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знает основные понятия и постановки задач машинного обучения
  • Знает теоретические основы линейных и логических методов машинного обучения
  • Знает принципы построения композиций моделей
  • Знает основные метрики качества для регрессии и классификации
  • Умеет выполнять полный цикл построения модели
  • Умеет обучать основные модели машинного обучения, оценивать их качества
  • Умеет выполнять кластеризацию и визуализацию данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает основные метрики качества для регрессии и классификации
  • Знает принципы построения композиций моделей
  • Умеет выполнять полный цикл построения модели
  • Знает основные понятия и постановки задач машинного обучения
  • Знает теоретические основы линейных и логических методов машинного обучения
  • Умеет выполнять кластеризацию и визуализацию данных
  • Умеет обучать основные модели машинного обучения, оценивать их качества
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основные понятия и задачи в машинном обучении
  • Рекомендательные системы
  • Обучение без учителя: понижение размерности и визуализация
  • Обучение без учителя: кластеризация
  • Градиентный бустинг
  • Композиции: бэггинг, блендинг и стэкинг
  • Метод k ближайших соседей
  • Линейная регрессия
  • Обучение градиентными методами
  • Метрики классификации
  • Решающие деревья
  • Линейная классификация: методы и общие принципы
Элементы контроля

Элементы контроля

  • неблокирующий Домашние работы
    Вы можете пропустить экзамен, если средняя оценка за домашние работы не меньше, чем 5.5, т.е. (HW >=5.5).
  • неблокирующий Экзамен
    Вы можете пропустить экзамен, если средняя оценка за домашние работы не меньше, чем 5.5, т.е. (HW >=5.5). Тогда: Итоговая оценка = ROUND(HW)
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.3 * Экзамен + 0.7 * Домашние работы
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705

Рекомендуемая дополнительная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008