Магистратура
2020/2021
Методы машинного обучения
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Прикладная политология)
Направление:
41.04.04. Политология
Кто читает:
Департамент политики и управления
Где читается:
Факультет социальных наук
Когда читается:
1-й курс, 2, 3 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Филиппов Илья Борисович
Прогр. обучения:
Прикладная политология
Язык:
русский
Кредиты:
4
Контактные часы:
64
Программа дисциплины
Аннотация
Дисциплина "Методы машинного обучения" предназначена для подготовки магистров направления 41.04.04 «Политология». В курсе изучаются основные постановки задач машинного обучения, а также методы, необходимые для их решения. В частности, в курсе рассматриваются методы обучения с учителем (линейные методы, решающие деревья, композиции алгоритмов) и без учителя (методы кластеризации, понижения размерности данных). В курсе также обсуждаются вопросы визуализации данных и их предварительной обработки. Теоретические знания, полученные на занятиях, подкрепляются практическими занятиями по использованию популярных инструментов по изучаемой тематике.
Цель освоения дисциплины
- Ознакомление студентов с основными принципами машинного обучения – а именно, видами задач машинного обучения, классами моделей, способами обработки различных типов данных и измерение качества результатов
- Формирование у студентов практических навыков работы с данными и решения прикладных задач анализа данных с помощью современного программного обеспечения
Планируемые результаты обучения
- Знать основные типы задач в машинном обучении и уметь определять тип задачи
- Знать и уметь применять основные виды методов обучения с учителем
- Знать и уметь применять основные виды методов обучения без учителя
- Уметь приводить категориальные и текстовые данные к виду, допускающему обучение и применение на них моделей, изученных в курсе
Содержание учебной дисциплины
- Введение в машинное обучение и анализ данныхОсновные понятия в машинном обучении: объект, признак, выборка, модель, обучение и применение модели. целевая переменная, функционал качества. Типы задач в машинном обучении (с примерами): регрессия, классификация, понижение размерности данных, кластеризация, ранжирование. Типы данных и методы их обработки. Освоение с библиотеками numpy и pandas
- Основные методы обучения с учителемЛинейные модели, метрические методы, деревья решений, композиции. Функции потерь и методы оптимизации (градиентный спуск). Метрики качества классификации и регрессии, оценка обобщающей способности алгоритмов. Регуляризация.
- Методы обучения без учителяПостановка задачи кластеризации и методы ее решения (K-means, иерархическая кластеризация, DBSCAN и т.п.) Оценка качества кластеризации. Задача понижения размерности признаков, отбор признаков, методы визуализации (PCA, t-SNE и т.п.).
- Методы работы с категориальными и текстовыми даннымиМетоды кодирования категориальных признаков (one-hot encoding, mean target encoding, хэширование). Методы обработки текстовых данных (bag-of-words, tf-idf, word2vec и прочие представления).
Элементы контроля
- Домашнее задание 1
- Домашнее задание 2
- Домашнее задание 3
- Контрольная работа 1
- Контрольная работа 2
- Контрольная работа 3
- Контрольная работа 4
- Контрольная работа 5
- Контрольная работа 6
- Индивидуальный проект
- Коллоквиум
- Экзамен (устный)Экзамен проводится в устной форме (опрос по материалам курса).
- Домашнее задание 1
- Домашнее задание 2
- Домашнее задание 3
- Контрольная работа 1
- Контрольная работа 2
- Контрольная работа 3
- Контрольная работа 4
- Контрольная работа 5
- Контрольная работа 6
- Командный проект
- Коллоквиум
- Экзамен (устный)Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе Zoom (https://zoom.us/). К экзамену необходимо подключиться согласно расписанию ответов, указанному на странице курса накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка zoom. Для участия в экзамене студент обязан: явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками в процессе ответа на теоретические вопросы, а также пользоваться подсказками в процессе решения задач. Кратковременным нарушением связи во время экзамена считается нарушение связи менее минуты. Долговременным нарушением связи во время экзамена считается нарушение минута и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи подразумевает использование усложненных заданий.
Промежуточная аттестация
- Промежуточная аттестация (3 модуль)0.06 * Домашнее задание 1 + 0.06 * Домашнее задание 2 + 0.06 * Домашнее задание 3 + 0.2 * Коллоквиум + 0.2 * Командный проект + 0.02 * Контрольная работа 1 + 0.02 * Контрольная работа 2 + 0.02 * Контрольная работа 3 + 0.02 * Контрольная работа 4 + 0.02 * Контрольная работа 5 + 0.02 * Контрольная работа 6 + 0.3 * Экзамен (устный)
Список литературы
Рекомендуемая основная литература
- Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
- James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
Рекомендуемая дополнительная литература
- Ruud, A. (2019). Convex Optimization: Theory, Methods and Applications. Hauppauge, New York: Nova. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2043454