• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2019/2020

Прикладные задачи анализа данных

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Майнор
Когда читается: 3, 4 модуль
Преподаватели: Багиян Нерсес Карленович, Валиуллин Адель Марсович, Игнатов Дмитрий Игоревич, Ковалёв Алексей Константинович, Скрынник Алексей Александрович, Соколов Евгений Андреевич
Язык: русский
Кредиты: 5

Программа дисциплины

Аннотация

Дисциплина "Прикладные задачи анализа данных" является завершающей в майноре "Интеллектуальный анализ данных" и направлена на выполнение двух целей. Первая — научить прикладной статистике, которая связана с внедрением машинного обучения и анализом результатов. Сюда относится анализ и сравнение моделей, интерпретация моделей машинного обучения, планирование и анализ результатов A/B-тестов. Вторая — дать опыт решения сложных задач с помощью методов машинного обучения. А именно, рассматриваются задачи обработки естественного языка, работы с изображениями и сигналами, прогнозирования временных рядов, построение рекомендательных систем.
Цель освоения дисциплины

Цель освоения дисциплины

  • Владеть методами прикладной статистики
  • Уметь решать прикладные задачи методами машинного обучения
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь интерпретировать модели машинного обучения
  • Уметь планировать и анализировать результаты A/B-тестов
  • Владеть методами прогнозирования временных рядов
  • Знать основные метрики качества рекомендательных систем
  • Уметь строить рекомендательные системы
  • Уметь решать основные задачи анализа изображений и сигналов
  • Владеть базовыми методами анализа текстов
  • Уметь решать сложные задачи анализа текстов (машинный перевод и пр.)
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Прикладная статистика в машинном обучении
    Использование статистических методов при анализе линейных моделей. Интерпретация моделей машинного обучения. Статистическая проверка гипотез. A/B-тестирование.
  • Прогнозирование временных рядов
    Статистические методы прогнозирования. Прогнозирование с помощью машинного обучения.
  • Рекомендательные системы
    Методы на основе памяти. Коллаборативная фильтрация. Матричные разложния. Контентные рекомендации. Метрики качества рекомендаций.
  • Анализ изображений и сигналов
    Задачи компьютерного зрения. Анализ звуковых сигналов, нейросетевые подходы.
  • Анализ естественного языка
    Классификация текстов. Представления слов и текстов. Вопросно-ответные системы. Машинный перевод.
Элементы контроля

Элементы контроля

  • неблокирующий Самостоятельная работа
    Проверочные работы на семинарах (ПР)
  • неблокирующий Домашнее задание
    Практические домашние задания (ДЗ)
  • неблокирующий Экзамен
    Письменный экзамен (Э)
  • неблокирующий Контрольная работа
    Контрольная работа (КР)
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.4 * Домашнее задание + 0.2 * Контрольная работа + 0.1 * Самостоятельная работа + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Parul Aggarwal, Vishal Tomar, & Aditya Kathuria. (2017). Comparing Content Based and Collaborative Filtering in Recommender Systems. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.32D5064E

Рекомендуемая дополнительная литература

  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.