Бакалавриат
2025/2026



Анализ данных и машинное обучение
Статус:
Курс обязательный (Компьютерные науки и технологии)
Направление:
01.03.02. Прикладная математика и информатика
Когда читается:
3-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
60
Программа дисциплины
Аннотация
Изучение дисциплины нацелено на освоение основных методов и алгоритмов машинного обучения и анализа данных с применением языка программирования Python. В результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных и реализовывать различные модели машинного обучения с использованием языка программирования Python. В курсе используются технологии ИИ. Курс предполагает прохождение on-line курса https://edu.hse.ru/course/view.php?id=151704
Цель освоения дисциплины
- Целями освоения данной дисциплины является формирование у студентов представления об основных принципах обучения с учителем (например, задачи регрессии и классификации) и без учителя (например, задача кластеризации). А также умение применять сервисы ИИ и алгоритмы машинного обучения на практике, например в проектировании роботов (восприятие, контроль), анализе текстов (онлайн поиск, анти-спам), компьютерном зрении, медицинских информационных системах, обработке аудио, интеллектуальном анализе баз данных и других областях.
Планируемые результаты обучения
- Интерпретировать задачу кластеризации. Применять на практике основные алгоритмы кластеризации (k-means и иерархические методы) и метод главных компонент (PCA).
- интерпретировать алгоритмы машинного обучения (с учителем, без учителя)
- уметь интерпретировать задачу линейной регрессии и метрики качества
- уметь интерпретировать задачу линейной регрессии с многими переменными. Применять полученные знания на практике.
- интерпретировать задачи классификации (бинарная, множественная) и метрики качества для задач классификации
- Интерпретировать нейронные сети, уметь применять на практике нейронные сети из библиотеки Keras
- Интерпретировать задачу кластеризации. Применять на практике основные алгоритмы кластеризации (k-means и DBSCAN). Применять и сравнивать показатели качества для задачи кластеризации.
- Интерпретировать задачи классификации (бинарная, множественная). Интерпретировать и применять на практике метрики качества для задач классификации (Accuracy, Precision, Recall, F1).
Содержание учебной дисциплины
- Обзор основных алгоритмов машинного обучения. Задача линейной регрессии.
- Задача линейной регрессии с многими переменными. Регуляризация.
- Задача бинарной классификации. Метрики качества.
- Нейронные сети
- Кластеризация
- Метрики качества задачи кластеризации
- Обзор основных алгоритмов машинного обучения, которые могут применяться в медицине. Задачи машинного обучения (регрессия, классификация, кластеризация).
Список литературы
Рекомендуемая основная литература
- Bell, J. (2015). Machine Learning : Hands-On for Developers and Technical Professionals. Indianapolis, Ind: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=872454
Рекомендуемая дополнительная литература
- Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.