• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Прикладная математика и информатика»

10
Ноябрь

Специализация Машинное обучение и приложения

Руководители специализации: 
Ветров Дмитрий Петрович, к.ф.-м.н., профессор-исследователь департамента больших данных и информационного поиска ФКН НИУ ВШЭ, заведующий центром глубинного обучения и байесовских методов
Соколов Евгений Андреевич, заместитель руководителя департамента больших данных и информационного поиска ФКН НИУ ВШЭ, руководитель группы качества рекомендаций Яндекс.Дзен 

Машинное обучение — наука, которая изучает методы поиска скрытых зависимостей в массивах данных. Эти методы всё активнее используются как в различных областях науки (в физике, экономике, журналистике, социальных науках и т.д.), так и во многих индустриальных областях. Обнаружение спама, распознавание людей на фотографии, персонализованные рекомендации музыки в социальных сетях или товаров в онлайн-магазинах, определение лучшего хода в игре Го, предсказание эффекта от лекарства с определённой химической формулой — лишь немногие примеры важных и интересных задач, которые невозможно решить с помощью классического математического моделирования. Тем не менее, все эти задачи могут быть решены с помощью стандартных методов машинного обучения.

В конце нулевых годов появились вычислительные мощности, способные обрабатывать огромные массивы данных, благодаря которым оказалось, что методы современного машинного обучения способны в ряде областей превзойти возможности человеческого интеллекта. Сейчас происходит настоящая революция в области машинного обучения, связанная с переходом к т.н. глубинному обучению (deep learning). Из-за этого в мире ощущается острая нехватка кадров, поскольку ежегодная потребность в специалистах по современному машинному обучению сильно обгоняет объемы их выпуска университетами мира. Рынок машинного обучения уже сейчас оценивается в 50 миллиардов долларов, а специалист по машинному обучению (data scientist) считается одной из наиболее востребованных и высокооплачиваемых профессий 21 века.

На нашей специализации мы научим вас машинному обучению и дадим все необходимые навыки для решения задач анализа данных. В программу входят общий курс по машинному обучению, курсы по прикладным задачам анализа данных (анализ текстов, компьютерное зрение, анализ временных рядов). Кроме того, в ней присутствуют курсы по современным методам построения сложных вероятностных моделей обработки данных, работе с большими данными, глубинному обучению. Лекции читают ведущие учёные в области машинного обучения и практикующие специалисты Яндекса.



Поступление на специализацию 

Для поступления на специализацию «Машинное обучение и приложения» необходимо пройти отбор. К критериям относятся:

1. Рейтинг студента
2. Реферат по Вводному НИС 
3. Результаты выполнения проектов на младших курсах
4. Участие в соревнованиях или хакатонах по анализу данных

5. Рекомендации от преподавателей и сотрудников ВШЭ
Базовые курсы 3 года обучения
Курсы специализации 3 года обучения
Рекомендованные курсы по выбору 3 года обучения
Курсы специализации 4 года обучения
Научно-исследовательский семинар "Машинное обучение и приложения" 
Рекомендованные онлайн курсы (MOOCs)  



базовые курсы учебного плана 3 курса ПМИ (Major): 

1. Машинное обучение 1  

 

Соколов Евгений Андреевич

Департамент больших данных и информационного поиска: Старший преподаватель

 
курс читается: 1-2 модули  
Задача курса — научить слушателей находить скрытые закономерности в данных с помощью методов машинного обучения. На лекциях разбираются все основные модели (линейные, логические, метрические, байесовские) и постановки задач машинного обучения. Большое внимание уделяется прикладным аспектам анализа данных: метрикам качества, оцениванию обобщающей способности, подготовке данных и работе со сложными типами признаков. В курсе изучаются современные технологии и библиотеки, используемые в анализе данных. Все темы сопровождаются практическими заданиями на языке Python и соревнованиями по анализу данных.

2. Непрерывная оптимизация

курс читается: 3 модуль
Настройка модели алгоритмов по данным — это задача оптимизации, от эффективности решения которой зависит практическая применимость метода машинного обучения. В эпоху больших данных многие классические алгоритмы оптимизации становятся неприменимы, т.к. здесь требуется решать задачи оптимизации функций за время меньшее, чем необходимо для вычисления значения функции в одной точке. Таким требованиям можно удовлетворить в случае грамотного комбинирования известных подходов в оптимизации с учётом конкретной специфики решаемой задачи. Курс посвящен изучению классических и современных методов решения задач непрерывной оптимизации (в том числе невыпуклой), а также особенностям применения этих методов в задачах оптимизации, возникающих в машинном обучении. Наличие у слушателей каких-либо предварительных знаний по оптимизации не предполагается, все необходимые понятия разбираются в ходе занятий. Основной акцент в изложении делается на практические аспекты реализации и использования методов. Целью курса является выработка у слушателей навыков по подбору подходящего метода для своей задачи, наиболее полно учитывающего её особенности
.


3. Дискретная оптимизация

курс читается: 4 модуль
Цель данного курса — познакомить слушателей с типичными классами задач оптимизации, в которых множество допустимых решений имеет явно выраженную "комбинаторную" природу, а также с эффективными способами их решения. Большое число примеров подобных задач возникает, например, в теории графов (паросочетания, пути, упаковки, покрытия и раскраски и т.д.).

Помимо чисто комбинаторных методов в рамках данного курса акцент будет также сделан на применении теории линейного и целочисленного программирования. Помимо стандартных оптимизационных инструментов (таких как симплекс-метод, метод эллипсиоидов, метод внутренней точки) ключевыми здесь будут понятия линейной двойственности, а также различные свойства целочисленности линейных программ (тотальная унимодулярность и тотальная двойственная целочисленность). Все вместе это позволит единообразно описать широкий класс комбинаторных задач, решаемых за полиномиальное время.
Кроме точных алгоритмов (находящих искомый оптимум за полиномиальное время), в курсе также пойдёт речь о приближенных методах решения тех задач, для которых точное решение быстро найти, по-видимому, невозможно. Здесь на помощь снова на придут линейные релаксации, которые позволят эффективно строить приближенные решения, имеющие гарантированную погрешность.


 4. Введение в глубинное обучение  |  Introduction to Deep Learning

курс читается: 3 модуль | в формате blended на английском языке
The goal of this course is to give learners basic understanding of modern neural networks and their applications in computer vision and natural language understanding. The course starts with a recap of linear models and discussion of stochastic optimization methods that are crucial for training deep neural networks. Learners will study all popular building blocks of neural networks including fully connected layers, convolutional and recurrent layers. Learners will use these building blocks to define complex modern architectures in TensorFlow and Keras frameworks. In the course project a learner will implement deep neural network for the task of image captioning which solves the problem of giving a text description for an input image.The course is based on MOOC “Introduction to Deep Learning”  (Coursera.org, Developer – HSE).




 курсы специализации 3 года обучения: 

1. Машинное обучение 2
Лектор: Соколов Евгений Андреевич

Департамент больших данных и информационного поиска: Старший преподаватель

 

курс читается: 3-4 модули 
Данный курс посвящён изучению продвинутых методов и постановок задач анализа данных, а также теоретических основ алгоритмов машинного обучения. В программу курса входят нейронные сети, матричные разложения, рекомендательные системы, основы анализа текстов, методы активного и онлайн-обучения, обучение с подкреплением, основы теоретических оценок обобщающей способности. Семинарские занятия посвящены освоению практических особенностей изучаемых методов, знакомству с современными инструментами анализа данных и разбору подходов к решению прикладных задач.


2. Прикладной статистический анализ данных
Артемов Алексей Валерьевич

Базовая кафедра Яндекс: Доцент

 
курс читается: 1-2 модули
Курс посвящён методам статистического анализа данных, от базовых до высокоуровневых; он не содержит доказательств теорем и сложных математических выкладок, вместо этого основные задачи рассматриваются на большом количестве примеров из реальной жизни. Рассматриваемые методы оценки параметров и проверки гипотез дополняют курс машинного обучения. Практические задания даются на языке R.

 рекомендованные курсы по выбору 3 года обучения :

1. Вероятностные модели и статистика случайных процессов
Артемов Алексей Валерьевич

Базовая кафедра Яндекс: Доцент

 
курс читается: 3-4 модули
Курс дает теоретический и практический фундамент, необходимый при решении множества реальных промышленных задач, связанных с анализом данных в режиме реального времени. Необходимость в таких методах возникает во многих прикладных областях — например, при анализе временных рядов цен на акции, спроса на товары, числа посещений главной страницы интернет-поисковика. Трудность таких задач заключается в требовании максимально эффективного использования накопленной и поступающей информации для прогнозирования появления событий в неизвестном будущем или их обнаружения при неопределенном настоящем. Курс дает двоякие знания — математическую базу теории случайных процессов и навыки практической реализации алгоритмов анализа данных в оффлайн и онлайн-режимах. Будут рассмотрены основные подходы и вероятностные модели теории случайных процессов, такие как гауссовость, марковость, авторегрессионные модели, локально стационарные модели, модели в задачах скорейшего обнаружения; численные алгоритмы, в том числе сегментация, шумоподавление, оценка статистических характеристик, ключевые статистики в задачах обнаружения разладок и аномалий; слушателям будет предложена серия задач, направленных на анализ реальных данных посредством практического применения рассматриваемых подходов.

2. Численные методы в анализе данных

Лектор: Лобачёв Виктор Анатольевич, Ph.D., руководитель группы Yandex Data Factory
курс читается: 1-2 модули 
Цель курса – познакомить студентов с понятиями и методами вычислительной математики, а также продемонстрировать их применимость к задачам математического моделирования и обработки данных. В курсе студентам даются базовые представления о численном дифференцировании и интегрировании, методах интерполяции, решении систем линейных и нелинейных алгебраических уравнений, методах численного решения обыкновенных дифференциальных уравнений. Кроме теоретического материала, рассматривается приложение методов вычислительной математики к практическим задачам, в частности, к задаче моделирования и анализа алгоритмов показа Интернет-рекламы. На семинарских занятиях рассматриваются задания, способствующие закреплению пройденного материала.

 



курсы специализации 4 года обучения

1. Анализ неструктурированных данных
Лектор: Черняк Екатерина Леонидовна

Департамент анализа данных и искусственного интеллекта: Преподаватель

 
курс читается: 1-2 модули 
В курсе рассматриваются актуальные задачи обработки естественного языка — как хорошо изученные (оценка окраса текста, определение частей речи, определение языка, анализ морфологии, обучение с учителем на текстах и другие), так и активно развивающиеся (суммаризация текста, диалоговые системы и чат-боты и т.д.). Также изучаются подходы к работе с неструктурированными источниками данных, извлечению из них информации и её хранению. Весь материал сопровождается практическими задачами анализа интернет-данных и больших текстовых корпусов.



2. Байесовские методы машинного обучения

Лектор: Ветров Дмитрий Петрович

Департамент больших данных и информационного поиска: Доцент

 


курс читается: 1-2 модули 
Курс Курс посвящен т.н. байесовским методам решения задач машинного обучения, которые в настоящее время активно развиваются в мире. Большинство современных научных публикаций по машинному обучению используют вероятностное моделирование, опирающееся на байесовский подход к теории вероятностей. Основной задачей курса является привитие студентам навыков самостоятельного построения сложных вероятностных моделей обработки данных, используя стандартные модели в качестве своеобразных "кирпичиков". Особое внимание уделяется приближенным байесовским методам, позволяющим обсчитывать сложные вероятностные модели.


3. Компьютерное зрение

Лектор: Конушин Антон Сергеевич

Департамент больших данных и информационного поиска: Доцент

 
курс читается: 3 модуль 
В курсе рассматриваются основные понятия, задачи и методы анализа изображений. Список тем включает устройство зрительной системы человека, кацифровое представление изображений, модели цвета и базовые методы обработки изображений, классификацию изображений, выделение объектов, поиск изображений по содержанию, идентификацию человека, сопровождение объектов в видео и распознавание событий, основы построения трёхмерных моделей объектво по изображениям. Большое внимание будет уделяться современным нейросетевым моделям решения задач компьютерного зрения. Весь материал сопровождается практическими задачами. 


4. Глубинное обучение
Лектор: Осокин Антон Александрович

Департамент больших данных и информационного поиска: Доцент

 


курс читается: 3 модуль 
Глубинное обучение - стремительно развивающаяся область машинного обучения по большим объемам данных. В задачах, где объем обучающей выборки достаточно велик, методы глубинного обучения не просто значительно опережают все известные подходы, но и приближаются к возможностям человеческого интеллекта. Несмотря на то, что теория глубинных нейронных сетей еще не построена, они уже успешно применяются на практике. В этом курсе будут рассмотрены самые современные подходы к построению, обучению и применению глубинных нейронных сетей для решения различных индустриальных задач. Также будут рассмотрены способы встраивания нейронных сетей в более сложные модели обработки данных

рекомендованные онлайн курсы специализации:
 Рекомендованные MOOCs осваиваются в дополнение к основной программе по учебному плану 

1. Специализация Машинное обучение и анализ данных на Coursera 
2. Введение в машинное обучение на Coursera
3. Специализация Advanced Machine Learning

 

научно-исследовательский семинар "Машинное обучение и приложения":

Руководитель НИСа: Лобачева Екатерина Максимовна

Департамент больших данных и информационного поиска: Преподаватель

 
Руководитель НИСа: Струминский Кирилл Алексеевич

Департамент больших данных и информационного поиска: Преподаватель

Данный семинар является одной из форм организации научно-исследовательской деятельности студентов специализации “Машинное обучение и приложения”. На нём в течение года под руководством преподавателей студентам предлагается делать презентации исследовательских проектов, обзорные и отчётные доклады, в том числе в рамках написания курсовой работы и освоения дисциплин специализации. Семинар призван способствовать своевременному включению студентов в исследовательский процесс, равномерному распределению нагрузки при написании курсовых работ и усвоении учебного материала. Его задачей также является развитие навыков ведения научной дискуссии и презентации исследовательских результатов


↑ вернуться