2021/2022
Подготовка к соревнованиям по анализу данных
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Дисциплина общефакультетского пула
Где читается:
Факультет компьютерных наук
Когда читается:
1-4 модуль
Преподаватели:
Мельников Олег
Язык:
русский
Кредиты:
4
Контактные часы:
66
Программа дисциплины
Аннотация
Этот курс предназначен для подготовленных студентов, желающих поучаствовать в соревнованиях по машинному обучению на основе Kaggle.com и подобных платформ. Студенты будут работать в небольших группах под руководством преподавателя. На еженедельных встречах участники будут обсуждать интересные и релевантные статьи по машинному обучению, обмениваться идеями и стратегиями в текущих соревнованиях. Между встречами участники будут программировать свои идеи/стратегии, получать оценку из системы Kaggle.com и придумывать новые способы для улучшения результатов своих моделей машинного обучения. *** ПРЕДВАРИТЕЛЬНЫЕ НАВЫКИ включают курс по машинному обучению и/или нейронным сетям, а также имеют свежие знания в статистике, прикладной математике, линейной алгебре и программировании на языке Python. Если есть сомнения, то рекомендуется посмотреть на учебники для курса и оценить насколько их материал знаком и было ли уже применение таких моделей в каком-то другом курсе или в практике. В данном курсе мы будем применять эти знания для основной цели - выиграть соревнования. *** ВСТРЕЧИ проводятся через MS Teams по вторникам с 19:40 до 21:00 МСК, но можем поменять, если другое время всем будет удобнее.
Цель освоения дисциплины
- этот курс поможет студентам повысить свою экспертизу в соревнованиях, основанных на данных, в разработках моделей машинного обучения, в индивидуальной и командной работе.
Планируемые результаты обучения
- Студенты проанализируют результаты своих предыдущих моделей, разработают изменения в модели, протестируют модель локально и загрузят её в соревнование, чтобы получить следующий результат.
- Студенты разделятся на команды, просмотрят текущие соревнования на сайте Kaggle.com (или подобном), построят и загрузят базовые модели.
Элементы контроля
- Участие (оценка преподавателя)
- Прогресс в соревновании
- Участие (оценка студентов вне собственной группы)
- Участие (оценка согрупников)
Промежуточная аттестация
- 2021/2022 учебный год 4 модуль0.2 * Прогресс в соревновании + 0.3 * Участие (оценка согрупников) + 0.3 * Участие (оценка преподавателя) + 0.2 * Участие (оценка студентов вне собственной группы)
Список литературы
Рекомендуемая основная литература
- Trevor Hastie, Robert Tibshirani , et al., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd edition, 2017. Free from the publisher: https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12.pdf
Рекомендуемая дополнительная литература
- Ian Goodfellow and Yoshua Bengio and Aaron Courville. Deep Learning, 2016. URL: http://www.deeplearningbook.org