• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Методы машинного обучения

Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Прикладная политология)
Направление: 41.04.04. Политология
Когда читается: 1-й курс, 2, 3 модуль
Формат изучения: без онлайн-курса
Прогр. обучения: Прикладная политология
Язык: русский
Кредиты: 4
Контактные часы: 64

Программа дисциплины

Аннотация

Дисциплина "Методы машинного обучения" предназначена для подготовки магистров направления 41.04.04 «Политология». В курсе изучаются основные постановки задач машинного обучения, а также методы, необходимые для их решения. В частности, в курсе рассматриваются методы обучения с учителем (линейные методы, решающие деревья, композиции алгоритмов) и без учителя (методы кластеризации, понижения размерности данных). В курсе также обсуждаются вопросы визуализации данных и их предварительной обработки. Теоретические знания, полученные на занятиях, подкрепляются практическими занятиями по использованию популярных инструментов по изучаемой тематике.
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление студентов с основными принципами машинного обучения – а именно, видами задач машинного обучения, классами моделей, способами обработки различных типов данных и измерение качества результатов
  • Формирование у студентов практических навыков работы с данными и решения прикладных задач анализа данных с помощью современного программного обеспечения
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать основные типы задач в машинном обучении и уметь определять тип задачи
  • Знать и уметь применять основные виды методов обучения с учителем
  • Знать и уметь применять основные виды методов обучения без учителя
  • Уметь приводить категориальные и текстовые данные к виду, допускающему обучение и применение на них моделей, изученных в курсе
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в машинное обучение и анализ данных
    Основные понятия в машинном обучении: объект, признак, выборка, модель, обучение и применение модели. целевая переменная, функционал качества. Типы задач в машинном обучении (с примерами): регрессия, классификация, понижение размерности данных, кластеризация, ранжирование. Типы данных и методы их обработки. Освоение с библиотеками numpy и pandas
  • Основные методы обучения с учителем
    Линейные модели, метрические методы, деревья решений, композиции. Функции потерь и методы оптимизации (градиентный спуск). Метрики качества классификации и регрессии, оценка обобщающей способности алгоритмов. Регуляризация.
  • Методы обучения без учителя
    Постановка задачи кластеризации и методы ее решения (K-means, иерархическая кластеризация, DBSCAN и т.п.) Оценка качества кластеризации. Задача понижения размерности признаков, отбор признаков, методы визуализации (PCA, t-SNE и т.п.).
  • Методы работы с категориальными и текстовыми данными
    Методы кодирования категориальных признаков (one-hot encoding, mean target encoding, хэширование). Методы обработки текстовых данных (bag-of-words, tf-idf, word2vec и прочие представления).
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • неблокирующий Контрольная работа 1
  • неблокирующий Контрольная работа 2
  • неблокирующий Контрольная работа 3
  • неблокирующий Контрольная работа 4
  • неблокирующий Контрольная работа 5
  • неблокирующий Контрольная работа 6
  • неблокирующий Индивидуальный проект
  • неблокирующий Коллоквиум
  • неблокирующий Экзамен (устный)
    Экзамен проводится в устной форме (опрос по материалам курса).
  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • неблокирующий Контрольная работа 1
  • неблокирующий Контрольная работа 2
  • неблокирующий Контрольная работа 3
  • неблокирующий Контрольная работа 4
  • неблокирующий Контрольная работа 5
  • неблокирующий Контрольная работа 6
  • неблокирующий Командный проект
  • неблокирующий Коллоквиум
  • неблокирующий Экзамен (устный)
    Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе Zoom (https://zoom.us/). К экзамену необходимо подключиться согласно расписанию ответов, указанному на странице курса накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка zoom. Для участия в экзамене студент обязан: явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками в процессе ответа на теоретические вопросы, а также пользоваться подсказками в процессе решения задач. Кратковременным нарушением связи во время экзамена считается нарушение связи менее минуты. Долговременным нарушением связи во время экзамена считается нарушение минута и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи подразумевает использование усложненных заданий.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    0.06 * Домашнее задание 1 + 0.06 * Домашнее задание 2 + 0.06 * Домашнее задание 3 + 0.2 * Коллоквиум + 0.2 * Командный проект + 0.02 * Контрольная работа 1 + 0.02 * Контрольная работа 2 + 0.02 * Контрольная работа 3 + 0.02 * Контрольная работа 4 + 0.02 * Контрольная работа 5 + 0.02 * Контрольная работа 6 + 0.3 * Экзамен (устный)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.

Рекомендуемая дополнительная литература

  • Ruud, A. (2019). Convex Optimization: Theory, Methods and Applications. Hauppauge, New York: Nova. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2043454