• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Machine Learning

2023/2024
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
Joint Department with Sberbank ‘Financial Technologies and Data Analysis’
Course type:
Compulsory course
When:
1 year, 1, 2 module

Instructors


Васильев Роман Александрович

Программа дисциплины

Аннотация

Курс посвящен изучению основных методов машинного обучения. Изучаемые темы можно разбить на три блока. Первый — работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Второй блок — обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Третий блок — обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных. По итогам курса слушатель сможет сформулировать задачу машинного обучения, выбрать метрику качества, обучить модель, подобрать гиперпараметры, провести валидацию.
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление студентов с теоретическими основами и основными принципами машинного обучения — а именно, с классами моделей (линейные, логические, нейросетевые), метриками качествами и подходами к подготовке данных. Формирование у студентов практических навыков работы с данными и решения прикладных задач анализа данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимание принципов работы нейронных сетей
  • Знает основные метрики качества для регрессии и классификации
  • Знает принципы построения композиций моделей
  • Знает теоретические основы линейных и логических методов машинного обучения
  • Умеет обучать основные модели машинного обучения, оценивать их качества
  • Знает основные понятия и постановки задач машинного обучения
  • Умеет выполнять кластеризацию и визуализацию данных
  • Знает основные метрики качества для регрессии и классификации
  • Знает принципы построения композиций моделей
  • Умеет выполнять полный цикл построения модели
  • Умеет обучать основные модели машинного обучения, оценивать их качества
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в машинное обучение
  • Обучение без учителя
  • Линейные методы регрессии
  • Линейные методы классификации
  • Особенности работы с реальными данными
  • Работа с признаками
  • Решающие деревья
  • Композиции алгоритмов
  • Нейронные сети
  • Подходы к извлечению признаков для сложных данных
  • Рекомендательные системы
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа
  • неблокирующий Самостоятельные работы
    Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций
  • неблокирующий Практические домашние работы
  • неблокирующий Письменный экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 2 модуль
    0.15 * Контрольная работа + 0.3 * Письменный экзамен + 0.4 * Практические домашние работы + 0.15 * Самостоятельные работы
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008

Рекомендуемая дополнительная литература

  • Stephen Boyd, Lieven Vandenberghe, & Lieven V. (2015). Additional Exercises for Convex Optimization. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E7445CE1