• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

FacultiesCoursesApplied Mathematics and Information ScienceMathematical Modeling

Методы машинного обучения и разработки данных

Academic year: 2013/2014

Содержание курса охватывает основные устоявшиеся разделы современного машинного обучения и разработки данных (Data Mining). Курс опирается на знания и компетенции, полученные в таких дисциплинах как «Современная прикладная  алгебра», «Теория вероятности и математическая статистика», «Дискретная математика», «Теория графов», «Частично упорядоченные множества и решетки», «Теория алгоритмов» или «Алгоритмы и структуры данных», «Численные методы и методы оптимизации». При отсутствии у студентов необходимых минимальных знаний по указанным дисциплинам им сообщаются базовые определения и  предлагаются источники для самостоятельного изучения, что не является препятствием для успешного освоения курса. Необходимо умение разработки небольших программ на одном из современных языков программирования (например, Python, C#, Java или C++), а также желателен опыт работы со средой MATLAB или Octave и их аналогами. Курс помогает получить базовые компетенции аналитика данных, среди которых адекватный выбор метода для решения конкретной задачи анализа данных, предобработка данных, настройка параметров метода анализа, интерпретация полученных результатов. Курс является сопутствующим для следующих дисциплин: «Стохастическое моделирование», «Современный анализ данных», «Социальные сети и рекомендательные системы». В ходе курса предполагается индивидуальная или групповая работа над зачетным проектом по анализу реальных данных, а также выполнение домашних заданий. В ходе обучения студенты также знакомятся с программными продуктами Weka, Orange и средой R.

Основные разделы второй части курса

  • Статистический (Байесовский) взгляд на машинное обучение. Оптимальный байесовский классификатор. Непараметрическое и параметрическое оценивание плотности.
  • Разделение смеси распределений. EM-алгоритм.
  • Вероятностный латентно-семантический анализ (PLSA) и латентное размещение Дирихле. Тематическое моделирование.
  • Введение в вероятностные графические модели.
  • Метод опорных векторов.
  • Теория обобщающей способности. Элементы теория Вапника-Червоненкиса и комбинаторная теория переобучения.
  • Анализ частых последовательностей.
  • Система разработки данных и машинного обучения Knime.
  • Продвинутые алгоритмы разработки данных при наличии ограничений (Constraint-based Data Mining). n-мерные замкнутые множества и n-мерные ассоциативные правила.
  • Карты Кохонена. Многомерное шкалирование.
  • Ансамблевая кластеризация. Задача поиска наилучшего разбиения.
  • Ансамблевая классификация. Задача поиска наилучшей классификации.
  • Продвинутые модели и алгоритмы рекомендательные систем. Модель SVD++. Рекомендации в фолксономиях.
  • Задача анализа мнений.
Type: Compulsory course
Instructors: Gorchinskaya, Olga Y. (delivers lectures, conducts seminars and checks works), Ignatov, Dmitry I. (delivers lectures, conducts seminars, checks works and administers exams)
Delivered at: Department of Data Analysis and Artificial Intelligence (School of Applied Mathematics and Information Science)
Language: Russian
Level: Master
Area of studies: Applied Mathematics and Information Science
Master’s programme: Mathematical Modeling
When: 2 year, 1, 2 module
Credits: 6
Prerequisites:
Курс опирается на знания и компетенции, полученные в таких дисциплинах как «Современная прикладная алгебра», «Теория вероятности и математическая статистика», «Дискретная математика», «Теория графов», «Частично упорядоченные множества и решетки», «Теория алгоритмов» или «Алгоритмы и структуры данных», «Численные методы и методы оптимизации». Для успешного прохождения необходимо прослушать и завершить первую часть курса в 1-ом и 2-ом модулях.