• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Магистерская программа «Науки о данных»

Технологии моделирования сложных систем

Специализация "Технологии моделирования сложных систем", как и одноименная кафедра, создана в НИУ ВШЭ в 2011 г. на базе Института проблем передачи информации им. А. А. Харкевича РАН (ИППИ РАН) — признанного центра исследований по фундаментальным основам информационных технологий.

С 2019 года состав обязательных и вариативных курсов изменён. Студент специальности будет проходить базовую подготовку в двух направлениях: телекоммуникационные и распознающие системы с возможностью углубленного изучения каждого из этих направлений.

В связи с этим базовая программа дополнена курсом по цифровой обработке сигналов и вводным курсом по машинному обучению, а вариативная - набором курсов по анализу данных, машинному обучению (в том числе в телекоммуникациях), компьютерной лингвистике, робототехнике, программированию и смежным темам.

Обновленная учебная программа специализации ТМСС разрабатывалась так, чтобы обеспечить замкнутый процесс обучения, начиная от основ создания и исследования телекоммуникационных и распознающих систем, заканчивая полноценной научной деятельностью в этих направлениях.

Специализация предназначена для подготовки прикладных ученых высшей квалификации для научной работы и работы в высокотехнологичных отраслях, таких как:

  • информационные технологии для систем мобильной связи, беспроводного и проводного интернета;
  • технологии разработки индустриальных и экспериментальных распознающих систем.

Преподают и осуществляют научное руководство студентами специализации ведущие научные сотрудники ИППИ РАН.

Список новых курсов на ТМСС можно разделить на три группы: телекоммуникационные сети и системы, машинное обучение и приложения и, наконец, программирование.

Обучение на специализации ТМСС - это входной билет в сообщество ученых ИППИ РАН, возможность попробовать себя в решении реальных актуальных задач, возникающих в компьютерных науках и науках о данных.

Создание и исследование свойств телекоммуникационных систем - востребованная деятельность сейчас не только в науке, но и в индустрии. Активно разрабатываются и внедряются и стандартизуются технологии быстрого мобильного интернета, Wi-Fi нового поколения и протоколов передачи информации. Содержание выработанных стандартов имеет существенное влияние на индустрию, а потому требует высокого уровня научной и технической компетенции. На практике это выглядит следующим образом: большие компании собирают симпозиумы на которых, заручившись поддержкой ученых, вырабатывают новые технологические решения и стандарты передачи данных. Одна из научных групп, непосредственно вовлеченных в вопросы стандартизации представлена в ИППИ РАН. Специализация ТМСС нацелена на подготовку высококвалифицированных научных специалистов в этой области, будущих сотрудников ИППИ РАН.

В настоящее время активный рост систем распознавания и анализа данных уже не является неожиданностью. Первые волны эйфории от потенциала нейросетевых методов анализа изображений были ещё в первой половине прошлого столетия в том числе в ИППИ. Например, в 1962 году А. П. Петров опубликовал работу о бесперспективности разработки перцептрона Розенблатта для решения задач распознавания зрительных образов, что существенно сгладило первую волну эйфории о всемогуществе машинного обучения в СССР. Сейчас в области интересов института находятся такие области как анализ и распознавание изображений, анализ медицинских данных, лингвистика, анализ гео-локационных данных, робототехника и др. А потому учебный план ТМСС пополняется авторскими и классическими курсами, посвященными этим темам. Специализация ТМСС позволит вам обзавестись теоретическими и практическими знаниями, необходимыми для научной и инженерной деятельности в этом направлении.

Телекоммуникационные сети и системы

Цифровая обработка сигналов

Крещук Алексей Андреевич

к.т.н., старший научный сотрудник научно-учебной лаборатории телекоммуникационных систем

 

В курсе мы расскажем о теоретических основах цифровой обработки сигналов. Современные системы обработки сигналов, такие как GNU Radio и LabView позволяют спроектировать и реализовать свой передатчик практически "вслепую". Однако для того, чтобы понять, какие преобразования нужно применить к сигналу, и что будет, если применить их неправильно, необходимо понимать математическую теорию. В этом курсе вы узнаете: что такое нули и полюса фильтра и как они влияют на его устойчивость, что такое минимально-фазовые системы и системы с линейной фазой, и почему их нельзя совместить, как изменять частоту дискретизации сигнала, и зачем это делать в несколько этапов.

Элементы современной теории кодирования

Рыбин Павел Сергеевич

к.ф.-м.н.

 

Курс посвящен кодовым конструкциям (МПП (LDPC) коды, Полярные коды, сверточные коды и т.д.), активно используемым в современных стандартах связи. В рамках курса будут описаны методы построения и анализа таких конструкций, алгоритмы их кодирования и декодирования, сформулированы открытые вопросы и задачи.

Основы физического уровня: лаборатория по аналоговым и цифровым методам

Преподаватели: к.т.н. Игорь Жилин и к.т.н. Алексей Крещук

Часть 1: Современные системы связи и хранения данных в своей основе используют среды, по которым всё ещё распространяются аналоговые величины: амплитуды радиоволн, намагниченности жестких дисков и другие. В данном курсе кратко описано, какие они, как много и чего в них общего, какие есть отличия, какие перспективы развития, как сформировать сигнал, чтобы его передать и принять.

Часть 2: Системы программно-определяемого радио (SDR) позволяют быстро спроектировать и реализовать беспроводные системы связи, имея лишь минимальный опыт разработки таких систем. Данный курс даст вам этот опыт. В рамках курса на базе ADALM Pluto будет разработана аналоговая радиостанция.

Актуальные задачи машинного обучения в беспроводных сетях

Хоров Евгений Михайлович

к.ф.-м.н., заведующий научно-учебной лабораторией телекоммуникационных систем

 

Уже ни для кого не секрет, что методы машинного обучения оказываются полезными в самых разных научных областях. Наконец эта волна со всем своим инструментарием докатилась до науки о беспроводных сетях.

По-существу нейросетевые подходы иногда позволяют получать достаточно неплохие аппроксимации оптимумов невыпуклых функционалов, а методы машинного обучения - устанавливать зависимости в условиях шумных, недостаточных или даже противоречивых данных.

В рамках курса мы рассмотрим актуальные направления развития беспроводных сетей, фокусируясь на актуальных задачах, которые могут быть эффективно решены методами машинного обучения. Также мы определим задачи, где использование машинного обучения, по всей видимости, не является лучшим подходом.

Курс будет полезен студентам, которые разбираются в анализе данных и машинном обучении и хотят оставить свой след в развитии беспроводной связи.

Машинное обучение и приложения

Анализ сетевых данных

Современные learning-based подходы сетевого анализа позволяют решать постоянно расширяющийся круг задач. Мы расскажем о задачах: детекция аномального поведения в социальных сетях, анализ сетей головного мозга и поверхностей, заданных с помощью полигональных сеток, поиск оптимального пути на графе при условии изменения его во времени и др.

Tips and Tricks в анализе данных

Мусабаева Аягоз

 

 

Идея в том, чтобы рассказать о технических вещах, про которые не рассказывают в обычных курсах по машинному обучению и анализу данных. Что делать с пропусками или сильно скоррелированными данными. Как правильно делать аугментацию и какую,  если у вас данные с двух или более разных источников и т. д.

Интерпретируемые методы машинного обучения

Борзов Артём Сергеевич

 

 

Идея состоит в том, чтобы познакомить слушателей курса с методами машинного обучения, которые умеют не только выдавать правильные предсказания, но и «объяснять», на основе чего делается такое предсказание.

Хаф-анализ изображений

Ершов Егор Иванович

 

 

 

Григорьев Антон Сергеевич

 

 

В курсе мы расскажем об актуальных задачах обработки изображений и компьютерного зрения, об устройстве pipeline формирования цифрового изображения, о методах анализа изображений (ML vs Model-Based). Курс практический (требуются базовые знания python) и акцентирован на задачи поиска линейных объектов и их конфигураций (паспорта, банковские карточки, дорожная разметка, рельсы и пр) на изображении.

Вся правда о томографии

Ершов Егор Иванович

 

 

 

В этом курсе мы расскажем о математических и алгоритмических основах компьютерной томографии. Вы узнаете что такое преобразование Радона, преобразование Хафа, быстрое преобразование Хафа и как их обращать. Мы расскажем про те проблемы, с которыми сталкиваемся на практике и способы борьбы с ними. Курс предполагает возможность выполнения практических заданий.

Введение в робототехнику

Шипитько Олег

 

 

Курс посвящен основным алгоритмам современных мобильных роботов: локализации (фильтр Калмана, многочастичный фильтр), построения пути (алгоритм A*), управления (PID-регулятор, контроллеры следования по траектории и поддержания заданной скорости). Также будут рассмотрены кинематические модели различных колесных роботов и модели распространенных сенсоров (оптических камер, ультразвуковых датчиков, лазерных дальномеров).

Программирование роботов: Введение в ROS и комлексирование сенсоров

Шипитько Олег

 

 

Курс посвящен изучению популярного фреймворка Robot Operating System (ROS). На практических занятиях мы разработаем несколько модулей ПО (управление перемещением с клавиатуры, модуль локализации) и протестируем их в симуляциях роботов, входящих в состав ROS.

Introduction to Knowledge Representation (Введение в представление знаний)

Рыгаев Иван Петрович

 

 

Вот вам вопрос: как научиться хранить знания таким образом, чтобы программы могли осмысленно обрабатывать их и достигнуть тем подобия человеческого интеллекта? Что именно хочется? Делать корректные умозаключения, научиться из имеющихся знаний синтезировать новые, например, из двух фактов, что “Моня - слон” и “Все слоны серого цвета” следует, что Моня тоже серого цвета. 

Такого рода вопросы очень любопытны в контексте возможности создания автоматических систем доказательство математических теорем. Почему бы вместо доказательства теоремы “О трёх милиционерах” (о том, что последовательность сходится, если ограничивающие её сверху и снизу последовательности сходятся к одному пределу) не создать систему автоматического доказательства, не правда ли?

А сколько раз вы мучались, задавая поисковику вопрос и получая нерелевантный ответ, здорово было бы, если бы можно было запрашивать и искать смыслы. Эта концепция называется Semantic Web, о ней и о смежных темах (онтологии, семантические сети, концептуальные граф и др.) будут изложены в курсе.

Natural Language Processing in Python (Обработка естественного языка на Питоне)

Рыгаев Иван Петрович

 

 

В курсе будут рассмотрены основные средства и библиотеки языка Phyton по обработке естественного языка (NLTK - natural language toolkit). Токенизация, стемминг, морфологический и синтаксический парсинг, работа с семантикой, доступ к корпусам и лексическим ресурсам, классификация текстов, поиск именованных сущностей.

Machine learning in GIS

Дерендяев Александр Борисович

 

 

Геоинформационная система - это узкоспециализированный поисковик, для которого характерны вопросы типа: «Что находится в…?», «Где это находится?», «Что изменилось начиная с…?», «Какие пространственные структуры существуют?». Данный курс посвящен вопросам создания и развития такого рода систем.

Детальнее в курсе рассматривается система прогноза землетрясений. Вы узнаете каким образом распространяются подземные колебания, какими они бывают и много интересных деталей (например о существовании загадочной поверхности Мохоровичича, существование которой считается доказанным, но людям так и не удалось до неё докопаться).

Также в курсе будет описана система анализа данных о перемещении абонентов сотовой связи (какая точность у одного пеленга и как понять где находится абонент: на ленинском или на дублёре). Рассмотрена специфика сотовых данных и методы извлечения информации из них.

При разработке обеих упомянутых ГИС использовался ряд методов машинного обучения, таких как: MCMC (markov chain monte carlo, expectation maximization, метод минимальной тревоги и др.) о которых будет рассказано в курсе.

Программирование

Haskell

Крещук Алексей Андреевич

к.т.н., старший научный сотрудник научно-учебной лаборатории телекоммуникационных систем

 

Haskell несмотря на то, что на нём написано не слишком много больших проектов, имел огромное влияние на разработку языков программирования. Именно благодаря ему мы наблюдаем непрекращающийся рост популярности функционального программирования. Причиной такого успеха стала опора на теорию категорий и теорию типов, которые позволили действительно простые и удобные абстракции. В сочетании с чистым функциональным программированием и ленивыми вычислениями удалось создать язык, который очень просто читать, и непросто писать. В этом курсе мы изучим основы языка Haskell и его связь с теорий типов.

Seven Languages in Seven Weeks

Крещук Алексей Андреевич

к.т.н., старший научный сотрудник научно-учебной лаборатории телекоммуникационных систем

 

Есть мнение, что каждый программист должен изучать по одному новому языку программирования в год, чтобы не потерять квалификацию. В данном курсе мы изучим основу целых 7 языков, чтобы вам было что изучать следующие 7 лет. Вот список этих языков: Ruby, Io, Prolog, Scala, Erlang, Clojure, Haskell. Если вы уже программировали на всех семи, этот курс не для вас. В противном случае, добро пожаловать.