Бакалавриат
2025/2026





Машинное обучение для бизнеса
Статус:
Курс обязательный (Международная программа по бизнесу и экономике)
Кто читает:
Департамент экономики
Где читается:
Санкт-Петербургская школа экономики и менеджмента
Когда читается:
4-й курс, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
4
Контактные часы:
28
Программа дисциплины
Аннотация
Этот модульный курс является введением в инструменты машинного обучения. Среднее время освоения курса может варьироваться в зависимости от изначальной подготовки студента. Пререквизитом для освоения курса является знание математики на уровне среднего образования и основ языка программирования Python. Академические успехи студентов оцениваются посредством заданий на программирование в виде контестов, а также письменных элементов контроля в виде тестов. Итоговый экзамен представляет из себя контест с презентацией предложенных студентов способов решения. С помощью заданий курса отрабатываются базовые способы предобработки данных. построения моделей, интерпретации результатов. Курс не подразумевает проведение лекций, все теоретические материалы выдаются студентам на практических занятиях.
Цель освоения дисциплины
- • Понимание базовых правил синтаксиса, типов данных, встроенных конструкций • Создание пользовательских пайплайнов препроцессинга • Освоение основной библиотеки по машинному обучению на Python: sklearn • Формирование базовых навыков использования Python как инструмента классификации и прогнозирования
Планируемые результаты обучения
- Студент способен находить и устранять синтаксические и логические ошибки в скриптах
- Студент способен объяснить основные виды данных и постановки исследовательской задачи
- Студент способен создавать базовые модели машинного обучения для задач регрессии и классификации, задачи кластеризации
- Студент способен проводить анализ полученных результатов с целью описания экономических процессов
Содержание учебной дисциплины
- Тема 1. Постановка задач, типы данных, Пайплайны, рабочий процесс, bias variance tradeoff
- Тема 2. Классификация: Метрики, несбалансированность, мультикласс
- Тема 3. Классификация: SVM, логистическая регрессия, наивный байес, knn
- Тема 4. Регрессия: Метрики, lasso, ridge, elasticnet
- Тема 5. Случайный лес, градиентный бустинг, ансамбли
- Тема 6. Кластеризация: Метрики, scaling, normalization, kmean, dbscan
- Тема 7. Кластеризация: T-sne, PCA, Umap, gaussian mixture
Элементы контроля
- Семинарская работа
- Контест 1Контест 1 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки, результат студента отражается на лидерборде.
- Контест 2Контест 2 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки решения, результат студента отражается на лидерборде.
- Контест ЭкзаменКонтест Экзамен представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки решения, результат студента отражается на лидерборде. Студенты отправляют решения в .ipynb формате для проверки и подготавливают презентацию с обоснованием выбранных методов для решения. Студенты могут сдавать работу в группах до 4 человек.
Промежуточная аттестация
- 2025/2026 2nd module0.2 * Контест 1 + 0.2 * Контест 2 + 0.4 * Контест Экзамен + 0.2 * Семинарская работа
Список литературы
Рекомендуемая основная литература
- 9781800206571 - Serg Masís - Interpretable Machine Learning with Python : Learn to Build Interpretable High-performance Models with Hands-on Real-world Examples - 2021 - Packt Publishing - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2901980 - nlebk - 2901980
- Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS
Рекомендуемая дополнительная литература
- Spiliopoulou, M., Gesellschaft für Klassifikation, Schmidt-Thieme, L., & Janning, R. (2014). Data Analysis, Machine Learning and Knowledge Discovery. Cham: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=669270