Бакалавриат
2021/2022




Интеллектуальный анализ данных и основы машинного обучения
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Фундаментальная и прикладная лингвистика)
Направление:
45.03.03. Фундаментальная и прикладная лингвистика
Где читается:
Факультет гуманитарных наук (Нижний Новгород)
Когда читается:
3-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Охват аудитории:
для своего кампуса
Преподаватели:
Дурандин Олег Владимирович
Язык:
английский
Кредиты:
3
Контактные часы:
84
Course Syllabus
Abstract
The course introduces to the students some basic approaches and principles of data mining, the main methods of machine learning and the limits of these methods, the main methods of the quality evaluation.
Learning Objectives
- The purpose of the course is to familiarize students with the basic principles and methods of data analysis and machine learning
Expected Learning Outcomes
- Able to train logistic regression and KNN, understand quality metrics.
- Has an idea of classification based on decision trees and ensemble models, knows how to train them
- Has an idea of classification based on SVM and various parameters of the model, is able to train the model
- Has an understanding of the clustering problem and various algorithms, is able to train clustering models, understands clustering evaluation
- Has an understanding of the spectrum of machine learning tasks
- Has the idea of the "curse of dimensionality", is able to reduce the dimensionality with various methods
- Is able to train polynomial regression and understand its quality metrics, to identify overfitting and underfitting, to estimate quality during cross-validation
- Knows how to train linear regression, understands its quality metrics
- Understands the most important principles of EDA, is able to prepare data for machine learning algorithms
Course Contents
- Introduction. Examples of practical tasks.
- Exploratory Data Analysis (EDA)
- Linear regression
- Polynomial regression. The concept of overfitting and regularization.
- Classification problem. Logistic regression. The KNN algorithm. Naïve Bayes Classifier.
- Classification algorithms: decision trees and ensembles
- Support vector machines
- Unsupervised machine learning tasks. Dimension reduction
- Unsupervised machine learning tasks. The task of clustering
Assessment Elements
- Laboratory work
- Control work
- Exam"Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе MS Teams (https://teams.microsoft.com). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка MS Teams. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи."
Bibliography
Recommended Core Bibliography
- Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)
Recommended Additional Bibliography
- Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка ; перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.