• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
ФакультетыУчебные курсы010400.68 Прикладная математика и информатикаМатематическое моделированиеИнтеллектуальные системы

Методы машинного обучения и разработки данных

Учебный год: 2013/2014

Содержание курса охватывает основные устоявшиеся разделы современного машинного обучения и разработки данных (Data Mining). Курс опирается на знания и компетенции, полученные в таких дисциплинах как «Современная прикладная  алгебра», «Теория вероятности и математическая статистика», «Дискретная математика», «Теория графов», «Частично упорядоченные множества и решетки», «Теория алгоритмов» или «Алгоритмы и структуры данных», «Численные методы и методы оптимизации». При отсутствии у студентов необходимых минимальных знаний по указанным дисциплинам им сообщаются базовые определения и  предлагаются источники для самостоятельного изучения, что не является препятствием для успешного освоения курса. Необходимо умение разработки небольших программ на одном из современных языков программирования (например, Python, C#, Java или C++), а также желателен опыт работы со средой MATLAB или Octave и их аналогами. Курс помогает получить базовые компетенции аналитика данных, среди которых адекватный выбор метода для решения конкретной задачи анализа данных, предобработка данных, настройка параметров метода анализа, интерпретация полученных результатов. Курс является сопутствующим для следующих дисциплин: «Стохастическое моделирование», «Современный анализ данных», «Социальные сети и рекомендательные системы». В ходе курса предполагается индивидуальная или групповая работа над зачетным проектом по анализу реальных данных, а также выполнение домашних заданий. В ходе обучения студенты также знакомятся с программными продуктами Weka, Orange и средой R.

Основные разделы второй части курса

  • Статистический (Байесовский) взгляд на машинное обучение. Оптимальный байесовский классификатор. Непараметрическое и параметрическое оценивание плотности.
  • Разделение смеси распределений. EM-алгоритм.
  • Вероятностный латентно-семантический анализ (PLSA) и латентное размещение Дирихле. Тематическое моделирование.
  • Введение в вероятностные графические модели.
  • Метод опорных векторов.
  • Теория обобщающей способности. Элементы теория Вапника-Червоненкиса и комбинаторная теория переобучения.
  • Анализ частых последовательностей.
  • Система разработки данных и машинного обучения Knime.
  • Продвинутые алгоритмы разработки данных при наличии ограничений (Constraint-based Data Mining). n-мерные замкнутые множества и n-мерные ассоциативные правила.
  • Карты Кохонена. Многомерное шкалирование.
  • Ансамблевая кластеризация. Задача поиска наилучшего разбиения.
  • Ансамблевая классификация. Задача поиска наилучшей классификации.
  • Продвинутые модели и алгоритмы рекомендательные систем. Модель SVD++. Рекомендации в фолксономиях.
  • Задача анализа мнений.
Статус: Курс обязательный
Преподаватели: Горчинская Ольга Юрьевна (читает лекции, ведет семинары и проверяет работы), Игнатов Дмитрий Игоревич (читает лекции, ведет семинары, проверяет работы и принимает экзамены/зачеты)
Кто читает: Кафедра анализа данных и искусственного интеллекта (Отделение прикладной математики и информатики)
Язык: русский
Уровень: Магистратура
Направление: 010400.68 Прикладная математика и информатика
Прогр. обучения: Математическое моделирование
Специализация: Интеллектуальные системы
Когда читается: 2-й курс, 1, 2 модуль
Кредитов: 6
Пререквизиты:
Курс опирается на знания и компетенции, полученные в таких дисциплинах как «Современная прикладная алгебра», «Теория вероятности и математическая статистика», «Дискретная математика», «Теория графов», «Частично упорядоченные множества и решетки», «Теория алгоритмов» или «Алгоритмы и структуры данных», «Численные методы и методы оптимизации». Для успешного прохождения необходимо прослушать и завершить первую часть курса в 1-ом и 2-ом модулях.