Бакалавриат
2019/2020
Машинное обучение и нейросети
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Медиакоммуникации)
Направление:
42.03.05. Медиакоммуникации
Кто читает:
Институт медиа
Где читается:
Факультет креативных индустрий
Когда читается:
4-й курс, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Гилазтдинов Рустам Рафаилович
Язык:
русский
Кредиты:
3
Контактные часы:
38
Программа дисциплины
Аннотация
Настоящая программа учебной дисциплины устанавливает минимальные требования к знаниям и умениям студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов курса по выбору «Машинное обучение и нейросети». Программа разработана в соответствии с образовательным стандартом Федерального государственного автономного образовательного учреждения высшего образования «Национальный исследовательский университет «Высшая школа экономики» по направлению подготовки 42.03.05 Медиакоммуникации для квалификации «бакалавр».
Цель освоения дисциплины
- Овладение студентами моделями и методами интеллектуального анализа данных и машинного обучения.
- Изучение способов обработки данных.
- Освоение инструментария для анализа текстовых данных.
- Приобретение навыков исследователя данных.
- Формирование навыков использовать и анализировать данные разных форматов и разных источников.
Планируемые результаты обучения
- Использует основные модели и методы машинного обучения и разработки.
- Применяет модели и методы машинного обучения в специализированном программной обеспечении.
- Анализирует реальные данные с помощью методов машинного обучения.
Содержание учебной дисциплины
- Введение в машинное обучениеПроект машинного обучения. Обучение моделей. Использование моделей машинного обучения. Современные практики, сценарии и кейсы применения моделей машинного обучения.
- Подготовка, чтение, работа с даннымиSQL, pandas, open datasets
- Алгоритмы машинного обученияКлассификация, регрессия. Деревья принятия решений. Методы опорных векторов. Ансамблевое обучение и случайные леса.
- Рекомендательные системыКлассификация рекомендательных систем. Контентные рекомендательные системы. Коллаборативная фильтрация: сходство по пользователям (user-based) и сходство по признакам (item-based). Оценка качества рекомендательных систем (Precision, Recall, F1-мера, HitRate, MAE, RMSE, NDCG).
- Microsoft Azure Machine Learning StudioИзучение возможностей облачной среды Microsoft Azure Machine Learning Studio для решения задач машинного обучения
- Область автоматической обработки текстовЕстественный язык и текст. Особенности обработки естественных языков. Лингвистический анализ. Извлечение признаков. Прикладные задачи обработки текста
- Векторная модель текста и классификация текстовВекторная модель текста, BOW, TF-IFD. Логистическая регресия.
- Нейронные сетиМатематическая модель нейрона. Восстановление зависимости нейронной сетью. Компоненты нейронной сети. Алгоритм настройки нейронной сети. Методы оптимизации. Регуляризация и нормализация.
- Нейросетевые методы работы с текстамиОбщий алгоритм работы с текстами с помощью нейросетей. Дистрибутивная семантика и векторные представления слов. Основные виды нейросетевых моделей для обработки текстов. Сверточные нейронные сети для обработки текстов.
- Языковые модели и генерация текстаРекуррентные нейронные сети. Моделирование языка. Агрегация, механизм внимания. Преобразование последовательностей (seq2seq).
- Transfer learning, адаптация моделейКонтекстуализированные представления и перенос знаний
- Полный проект машинного обученияОформление проекта, решающего задачу машинного обучения
Элементы контроля
- Самостоятельная работа 1
- Самостоятельная работа 2
- Самостоятельная работа 3
- Самостоятельная работа 4
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.25 * Самостоятельная работа 1 + 0.25 * Самостоятельная работа 2 + 0.25 * Самостоятельная работа 3 + 0.25 * Самостоятельная работа 4
Список литературы
Рекомендуемая основная литература
- Барский А.Б. - Введение в нейронные сети - Национальный Открытый Университет "ИНТУИТ" - 2016 - 358с. - ISBN: - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100684
- Вьюгин В.В. - Математические основы машинного обучения и прогнозирования - Московский центр непрерывного математического образования - 2014 - 304с. - ISBN: 978-5-4439-2014-6 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/56397
- Чубукова И.А. - Data Mining - Национальный Открытый Университет "ИНТУИТ" - 2016 - 470с. - ISBN: 978-5-94774-819-2 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100582
Рекомендуемая дополнительная литература
- Калинина В.Н., Соловьев В.И. - Анализ данных. Компьютерный практикум (для бакалавров). Учебное пособие - КноРус - 2017 - 166с. - ISBN: 978-5-406-04895-5 - Текст электронный // ЭБС BOOKRU - URL: https://book.ru/book/929386
- Теория вероятностей и математическая статистика: учеб. пособие / Под ред. В.И. Ермакова. - М.: ИНФРА-М, 2004. - 287 с.: 60x90 1/16. - (Высшее образование). - Режим доступа: http://znanium.com/catalog/product/76845