• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2022/2023

Машинное обучение 1

Статус: Маго-лего
Когда читается: 3, 4 модуль
Онлайн-часы: 14
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 6
Контактные часы: 64

Программа дисциплины

Аннотация

Теория обучения машин (machine learning, машинное обучение) находится на стыке прикладной статистики, численных методов оптимизации, дискретного анализа, и за последние 50 лет оформилась в самостоятельную математическую дисциплину. Методы машинного обучения составляют основу ещё более молодой дисциплины — интеллектуального анализа данных (data mining). В курсе рассматриваются основные задачи обучения по прецедентам: классификация, кластеризация, регрессия, понижение размерности. Изучаются методы их решения, как классические, так и новые, созданные за последние 10–15 лет. Упор делается на глубокое понимание математических основ, взаимосвязей, достоинств и ограничений рассматриваемых методов. Отдельные теоремы приводятся с доказательствами. Все методы излагаются по единой схеме: исходные идеи и эвристики; их формализация и математическая теория; описание алгоритма в виде слабо формализованного псевдокода; анализ достоинств, недостатков и границ применимости; пути устранения недостатков; сравнение с другими методами. примеры прикладных задач.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать типологию задач машинного обучения
  • Уметь работать с различными типами данных
  • Владеть методами из библиотеки scikit-learn
  • Знать основные модели, используемые для решения задач классификации и регрессии
  • Владеть методами теоретического исследования моделей машинного обучения
  • Знать концепцию переобучения, причины возникновения этого явления, методы его преодоления
Планируемые результаты обучения

Планируемые результаты обучения

  • владеть методами из библиотеки scikit-learn
  • владеть методами теоретического исследования моделей машинного обучения
  • знать концепцию переобучения, причины возникновения этого явления, методы его преодоления
  • знать основные модели, используемые для решения задач классификации и регрессии
  • уметь подбирать гиперпараметры модели
  • уметь работать с различными типами данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение.
  • Несбалансированные выборки. Счетчики
  • Прогнозирование временных рядов
  • Байесовские методы классификации
  • Градиентные линейные методы
  • Соревнования по анализу данных
  • Решающие деревья и случайные леса
  • Метрические алгоритмы
  • Метрики качества, отбор признаков, работа с пропущенными значениями
  • Метод опорных векторов
  • Линейная регрессия и метод главных компонент
  • Нелинейная регрессия и нестандартные функции потерь
  • Многоклассовая классификация. Разреженные признаки. Библиотека VW
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Экзамен
    Оценка за дисциплину выставляется в соответствии с формулой оценивания от всех пройденных элементов контроля. Экзамен не проводится.
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.3 * Домашнее задание 2 + 0.3 * Домашнее задание 1 + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • Inge, R., & Leif, J. (2017). Machine Learning : Advances in Research and Applications. Hauppauge, New York: Nova Science Publishers, Inc. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1652565

Рекомендуемая дополнительная литература

  • Mohammed, M., Khan, M. B., & Bashier, E. B. M. (2017). Machine Learning : Algorithms and Applications. Boca Raton: CRC Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1293656
  • Mojrian, S., Pinter, G., Joloudari, J. H., Felde, I., Nabipour, N., Nadai, L., & Mosavi, A. (2019). Hybrid Machine Learning Model of Extreme Learning Machine Radial basis function for Breast Cancer Detection and Diagnosis; a Multilayer Fuzzy Expert System. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsarx&AN=edsarx.1910.13574