• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Машинное обучение и нейросети

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс по выбору (Медиакоммуникации)
Направление: 42.03.05. Медиакоммуникации
Когда читается: 4-й курс, 2 модуль
Формат изучения: без онлайн-курса
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Настоящая программа учебной дисциплины устанавливает минимальные требования к знаниям и умениям студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов курса по выбору «Машинное обучение и нейросети». Программа разработана в соответствии с образовательным стандартом Федерального государственного автономного образовательного учреждения высшего образования «Национальный исследовательский университет «Высшая школа экономики» по направлению подготовки 42.03.05 Медиакоммуникации для квалификации «бакалавр».
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладение студентами моделями и методами интеллектуального анализа данных и машинного обучения.
  • Изучение способов обработки данных.
  • Освоение инструментария для анализа текстовых данных.
  • Приобретение навыков исследователя данных.
  • Формирование навыков использовать и анализировать данные разных форматов и разных источников.
Планируемые результаты обучения

Планируемые результаты обучения

  • Использует основные модели и методы машинного обучения и разработки.
  • Применяет модели и методы машинного обучения в специализированном программной обеспечении.
  • Анализирует реальные данные с помощью методов машинного обучения.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в машинное обучение
    Проект машинного обучения. Обучение моделей. Использование моделей машинного обучения. Современные практики, сценарии и кейсы применения моделей машинного обучения.
  • Подготовка, чтение, работа с данными
    SQL, pandas, open datasets
  • Рекомендательные системы
    Классификация рекомендательных систем. Контентные рекомендательные системы. Коллаборативная фильтрация: сходство по пользователям (user-based) и сходство по признакам (item-based). Оценка качества рекомендательных систем (Precision, Recall, F1-мера, HitRate, MAE, RMSE, NDCG).
  • Алгоритмы машинного обучения
    Классификация, регрессия. Деревья принятия решений. Методы опорных векторов. Ансамблевое обучение и случайные леса.
  • Microsoft Azure Machine Learning Studio
    Изучение возможностей облачной среды Microsoft Azure Machine Learning Studio для решения задач машинного обучения
  • Область автоматической обработки текстов
    Естественный язык и текст. Особенности обработки естественных языков. Лингвистический анализ. Извлечение признаков. Прикладные задачи обработки текста
  • Векторная модель текста и классификация текстов
    Векторная модель текста, BOW, TF-IFD. Логистическая регресия.
  • Нейронные сети
    Математическая модель нейрона. Восстановление зависимости нейронной сетью. Компоненты нейронной сети. Алгоритм настройки нейронной сети. Методы оптимизации. Регуляризация и нормализация.
  • Нейросетевые методы работы с текстами
    Общий алгоритм работы с текстами с помощью нейросетей. Дистрибутивная семантика и векторные представления слов. Основные виды нейросетевых моделей для обработки текстов. Сверточные нейронные сети для обработки текстов.
  • Языковые модели и генерация текста
    Рекуррентные нейронные сети. Моделирование языка. Агрегация, механизм внимания. Преобразование последовательностей (seq2seq).
  • Transfer learning, адаптация моделей
    Контекстуализированные представления и перенос знаний
  • Полный проект машинного обучения
    Оформление проекта, решающего задачу машинного обучения
Элементы контроля

Элементы контроля

  • неблокирующий Самостоятельная работа 1
  • неблокирующий Самостоятельная работа 2
  • неблокирующий Самостоятельная работа 3
  • блокирующий Самостоятельная работа 4
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.25 * Самостоятельная работа 1 + 0.25 * Самостоятельная работа 2 + 0.25 * Самостоятельная работа 3 + 0.25 * Самостоятельная работа 4
Список литературы

Список литературы

Рекомендуемая основная литература

  • Барский А.Б. - Введение в нейронные сети - Национальный Открытый Университет "ИНТУИТ" - 2016 - 358с. - ISBN: - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100684
  • Вьюгин В.В. - Математические основы машинного обучения и прогнозирования - Московский центр непрерывного математического образования - 2014 - 304с. - ISBN: 978-5-4439-2014-6 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/56397
  • Чубукова И.А. - Data Mining - Национальный Открытый Университет "ИНТУИТ" - 2016 - 470с. - ISBN: 978-5-94774-819-2 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100582

Рекомендуемая дополнительная литература

  • Калинина В.Н., Соловьев В.И. - Анализ данных. Компьютерный практикум (для бакалавров). Учебное пособие - КноРус - 2017 - 166с. - ISBN: 978-5-406-04895-5 - Текст электронный // ЭБС BOOKRU - URL: https://book.ru/book/929386
  • Теория вероятностей и математическая статистика: учеб. пособие / Под ред. В.И. Ермакова. - М.: ИНФРА-М, 2004. - 287 с.: 60x90 1/16. - (Высшее образование). - Режим доступа: http://znanium.com/catalog/product/76845