• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Машинное обучение 2

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Направление: 01.03.02. Прикладная математика и информатика
Когда читается: 3-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Преподаватели: Рысьмятова Анастасия Александровна, Соколов Евгений Андреевич
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

Дисциплина Машинное обучение 2 является продолжением Машинного обучения 1 и посвящена дополнительным темам этой науки, а также отработки практических навыков по выполнению задач анализа данных. Изучаются продвинутые разделы машинного обучения (метрические методы и быстрый поиск ближайших соседей, ранжирование, рекомендательные системы, поиск аномалий) и теоретические основы машинного обучения. Также в курсе выполняется проект, направленный на полноценное решение реальной задачи с помощью Python и инструментов data scientist'а.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать продвинутые постановки задач в машинном обучении
  • Владеть методами для решения нестандартных задач машинного обучения
  • Уметь выполнять полный цикл решения задачи анализа данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать продвинутые постановки задач машинного обучения
  • Знать метрические методы машинного обучения и владеть методами быстрого поиска ближайших соседей
  • Уметь решать задачи поиска аномалий и кластеризации
  • Уметь решать задачи ранжирования
  • Владеть методами построения рекомендательных систем
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Обучение с учителем
    Продвинутые методы обучения линейных моделей. Хэширование признаков и случайные проекции. Методы отбора признаков. Обобщённые линейные модели. Современные имплементации градиентного бустинга. Ядровые методы. Метод k ближайших соседей в классификации и регрессии. Метрики на сложных объектах. Метрики на текстах на основе представлений слов. Методы поиска ближайших соседей. Locality-sensitive hashing. Обучение метрик, learning to hash.
  • Обучение без учителя
    Ядра, их теоретические основы и примеры применения для сложных объектов. Аппроксимация признаковых описаний в спрямляющем пространстве. EM-алгоритм. Тематическое моделирование, LDA. Генеративные модели. Продвинутые методы кластеризации. Лапласианы графов в машинном обучении. Методы обнаружения аномалий, одноклассовые методы.
  • Ранжирование и рекомендательные системы
    Матричные разложения и факторизационные машины; их применения в машинном обучении. Метрики качества рекомендательных систем. Обучение ранжированию. Метрики качества ранжирования. Поточечный, попарный и списочный подходы. Краудсорсинг при сборе разметки, оптимальная агрегация меток.
  • Задача адаптации признакового пространства (domain adaptation), transfer learning
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания (ДЗ)
  • неблокирующий Проверочные работы на семинарах (ПЗ)
  • неблокирующий Коллоквиум
  • неблокирующий Проект по анализу данных (П)
  • неблокирующий Письменный экзамен (Э)
    Экзамен письменный. Экзамен проходит с прокторингом через Examus в системе Moodle. Студенты получают задание, решают на бумаге, в конце загружают фотографии/сканы решений. Экзамен длится 2 астрономических часа. Во время экзамена разрешено только смотреть в условия задач и писать на листах бумаги, которые были чистыми до начала экзамена. Если у студента случился обрыв связи продолжительностью менее пяти минут, он может продолжить написание экзамена (дополнительное время при этом не предоставляется). Если случился обрыв связи продолжительностью дольше 5 минут, то считается, что студент пропустил экзамен. В этом случае ему будет предложено без штрафов сдать экзамен устно в течение недели с момента данного экзамена.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.3 * Домашние задания (ДЗ) + 0.2 * Коллоквиум + 0.25 * Письменный экзамен (Э) + 0.1 * Проверочные работы на семинарах (ПЗ) + 0.15 * Проект по анализу данных (П)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.

Рекомендуемая дополнительная литература

  • Trevor Hastie, Robert Tibshirani, & Jerome Friedman. New York. (n.d.). Book Reviews 567 The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.45E1D521