Магистратура
2021/2022
Машинное обучение на больших данных
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Машинное обучение и анализ данных)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Департамент информатики
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Брыксин Тимофей Александрович
Прогр. обучения:
Машинное обучение и анализ данных
Язык:
русский
Кредиты:
4
Контактные часы:
56
Программа дисциплины
Аннотация
Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков работы с большими данными и знакомит слушателей с основными задачами машинного обучения на больших данных, их особенностями и ограничениями. Для освоения дисциплины студентам необходимо иметь знания, полученные в результате изучения дисциплин «Математический анализ», «Линейная алгебра и геометрия», «Теория вероятностей и математическая статистика», «Алгоритмы и структуры данных», «Машинное обучение».
Цель освоения дисциплины
- Ознакомление студентов с основными задачами машинного обучения на больших данных, их особенностями и ограничениями.
Планируемые результаты обучения
- Владеть инструментами обработки данных в парадигме MapReduce
- владеть инструментами обработки данных в парадигме MapReduce;
- Знать особенности распараллеливания алгоритмов машинного обучения для применения на больших данных
- знать особенности распараллеливания алгоритмов машинного обучения для применения на больших данных;
- Уметь работать с большими данными в реальных задачах
- уметь работать с большими данными в реальных задачах.
Содержание учебной дисциплины
- Онлайн обучение и линейные модели
- Введение в Apache Spark и оптимизация гиперпараметров
- Рекомендательные системы
- Бустинг для больших данных
- Нейросети
- LSH для нахождения похожих объектов
- Кластеризация больших данных
Промежуточная аттестация
- 2021/2022 учебный год 4 модуль0.18 * Домашнее задание 3 + 0.16 * Домашнее задание 2 + 0.5 * Устный экзамен + 0.16 * Домашнее задание 1
Список литературы
Рекомендуемая основная литература
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- Murphy, K. P. (2012). Machine Learning : A Probabilistic Perspective. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=480968