• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Machine Learning

2022/2023
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
Faculty of Physics
Course type:
Compulsory course
When:
4 year, 1 module

Instructor

Программа дисциплины

Аннотация

Курс посвящён изучению основных методов машинного обучения. Изучаемые темы можно разбить на три блока. Первый — работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Второй блок — обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Третий блок — обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных. По итогам курса слушатель сможет сформулировать задачу машинного обучения, выбрать метрику качества, обучить модель, подобрать гиперпараметры, провести валидацию.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знает основные понятия и постановки задач машинного обучения
  • Знает теоретические основы линейных и логических методов машинного обучения
  • Знает принципы построения композиций моделей
  • Знает основные метрики качества для регрессии и классификации
  • Умеет выполнять полный цикл построения модели
  • Умеет обучать основные модели машинного обучения, оценивать их качества
  • Умеет выполнять кластеризацию и визуализацию данных
Планируемые результаты обучения

Планируемые результаты обучения

  • умеет решать задачи на данную тему
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение. Примеры задач. Логические методы: решающие деревья и решающие леса.
  • Метрические методы классификации. Линейные методы, стохастический градиент.
  • Метод опорных векторов (SVM). Логистическая регрессия. Метрики качества классификации.
  • Линейная регрессия. Понижение размерности, метод главных компонент.
  • Композиции алгоритмов, градиентный бустинг. Нейронные сети.
  • Кластеризация и визуализация. Частичное обучение.
  • Прикладные задачи анализа данных: постановки и методы решения.
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа
    письменная работа
  • неблокирующий Экзамен
    Письменная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 1 модуль
    0.5 * Контрольная работа + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081
  • Изучаем Python, Лутц, М., 2014
  • Шелудько, В. М. Основы программирования на языке высокого уровня Python : учебное пособие / В. М. Шелудько ; Южный федеральный университет. - Ростов-на-Дону ; Таганрог : Издательство Южного федерального университета, 2017. - 146 с. - ISBN 978-5-9275-2649-9. - Текст : электронный. - URL: https://new.znanium.com/catalog/product/1021662 - Текст : электронный. - URL: http://znanium.com/catalog/product/1021662

Рекомендуемая дополнительная литература

  • Bill Lubanovic. (2019). Introducing Python : Modern Computing in Simple Packages. [N.p.]: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2291494
  • Romano, F. (2015). Learning Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1133614