• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Прикладная математика и информатика»

Курсы по выбору (1-2 модули) для студентов 3 и 4 курсов

Студент выбирает 1 осенний курс по выбору из следующего списка:

Курсы по выбору для студентов 3 курса

Численные методы
Теория баз данных
Безопасность компьютерных систем
Принятие решений в условиях риска и неопределенности
Теория вычислений

Курсы по выбору для студентов 4 курса

Численные методы
Теория баз данных
Безопасность компьютерных систем
Принятие решений в условиях риска и неопределенности
Теория вычислений
Введение в теорию статистического обучения
Анализ неструктурированных данных

1. Численные методы

лектор:  Лобачёв Виктор Анатольевич, Ph.D., руководитель группы Yandex Data Factory

Цель курса – познакомить студентов с понятиями и методами вычислительной математики, а также продемонстрировать их применимость к задачам математического моделирования и обработки данных. В курсе студентам даются базовые представления о численном дифференцировании и интегрировании, методах интерполяции, решении систем линейных и нелинейных алгебраических уравнений, методах численного решения обыкновенных дифференциальных уравнений. Кроме теоретического материала, рассматривается приложение методов вычислительной математики к практическим задачам, в частности, к задаче моделирования и анализа алгоритмов показа Интернет-рекламы. На семинарских занятиях рассматриваются задания, способствующие закреплению пройденного материала.

Проект программы курса

2. Теория баз данных 

Лектор: Незнанов Алексей Андреевич

Департамент анализа данных и искусственного интеллекта: Доцент

 
Один из основных методологических принципов развития информационных технологий – абстракция (а точнее, абстракция данных в отличии от абстракции процессов) – естественным образом привёл исследователей и технологов к выделению предметной области под названием «базы данных» (БД). Она включает в себя теории, методы и технологии: 
1) формализации концептуальных, логических и физических моделей данных;
2) разработки универсальных языков манипулирования данными;
3) построения систем управления базами данных(СУБД) с различными характеристиками;
4) оптимального доступа к даннымв информационных системах с использованием СУБД.
Изучение теории баз данных является необходимым этапом как перед погружением в представление знаний, методы искусственного интеллекта и построение интеллектуальных систем, так и перед переходом на новый уровень в проектировании и реализации комплексных информационных систем.
В дисциплине можно выделить следующие пять основных разделов.
1. Информация и данные. Абстракция данных и модели данных. Причины и цели создания БД и СУБД. Основные характеристики БД и СУБД. Проблемы, возникающие при описании данных и манипулировании ими.
2. Формализация данных предметной области и инфологические модели. Модель «сущность-связь».
3. Даталогические модели данных. Реляционная модель данных: реляционная алгебра и реляционное исчисление. Реляционные базы данных и язык SQL. За пределами реляционной модели: NoSQL.
4. Физические модели данных. Проектирование баз данных, то есть создание и оптимизация схемы данных с использованием различных СУБД. Наполнение и тестирование БД в конкретной СУБД.
5. Доступ к данным в современных информационных системах. Интерфейсы и протоколы. Архитектуры информационных систем, использующих СУБД, включая многозвенные и распределённые.
Основное практическое содержание дисциплины - коллективное проектирование и наполнение базы данных для некоторой прикладной задачи и разработка приложения , использующего эту БД.  
Презентация курса
Проект программы курса

3. Безопасность компьютерных систем

Лектор: Гамаюнов Денис Юрьевич

Базовая кафедра Яндекс: Доцент

 
К современному программному обеспечению предъявляются все возрастающие требования по сохранности передаваемых, хранимых и обрабатываемых данных. В рамках данного курса слушатели познакомятся с некоторыми понятиями из области защиты информации и информационной безопасности, которые могут быть полезны в прикладной разработке и эксплуатации программного обеспечения. Слушатели познакомятся с такими элементами криптографии как симметричное и асимметричное шифрование, хеш-функции, аутентификация сообщений, протоколы SSL/TLS. Будут рассмотрены вопросы безопасности веб-приложений, в том числе SQL Injection и XSS, а также ряд других практических аспектов разработки безопасного ПО.
Проект программы курса

4. Принятие решений в условиях риска и неопределенности 

Лектор: Подиновский Владислав Владимирович

Департамент математики: Профессор-исследователь

 
В курсе будут описаны различные модели риска, способы сравнения различныхметодов измерения риска, анализ аварий и финансовых рисков, модели биржи и способы оценки риска при моделировании биржевых процессов, методы управленияриском.Будут рассмотрены основные модели принятия решений в условиях неопределенности(критерии Лапласа, Вальда, модели Сэвиджа и Гурвица). Будет дано описание деревьев решений и показано, какие пакеты программ можноприменять в этой задаче, подробно проанализированы методы оценки устойчивости решений. Модели будут проиллюстрированы на примере выбора инвестиционной стратегии.
Проект программы курса

5. Теория вычислений (преподается на английском языке)

Подольский Владимир Владимирович

Департамент больших данных и информационного поиска: Доцент

 
 
Баувенс Бруно Фредерик Л.

Департамент больших данных и информационного поиска: Доцент

 
Не всегда практическая задача, связанная с применением компьютеров, имеет чёткую математическую постановку. И даже если такая постановка есть, может оказаться, что в принципе не существует алгоритма, который решает соответствующую математическую задачу (она, как говорят, может быть алгоритмически неразрешимой). Наконец, задача может быть хотя и алгоритмически разрешимой, но вычислительно сложной - порой настолько, что с практической точки зрения она ничем не лучше алгоритмически неразрешимой. 
Теория вычислений как раз и занимается такими вопросами. Общая теория вычислимости позволяет понять, является ли задача алгоритмически разрешимой (и классифицирует алгоритмически неразрешимые задачи). Теория сложности вычислений изучает, прежде всего, класс "реально разрешимых задач", который в первом приближении отождествляется с полиномиально разрешимыми задачами. К сожалению, центральная проблема (P=NP) остаётся нерешённой, но тем не менее удаётся получить множество интересных условных результатов (в предположении трудности этой или близких задач, некоторые другие задачи являются трудными). 
Можно исследовать и более сложные ситуации, чем задачи разрешения: вместо того, чтобы узнавать, обладает ли исходное данное желаемым свойством, можно рассматривать интерактивный протокол, когда два участника обмениваются сообщениями (и имеют те или иные цели). Например, можно анализировать сложность игр, или сложность интерактивных доказательств (когда один участник должен убедить другого, что исходное данное обладает некоторым свойством), или криптографические задачи (когда два участника должны обменяться информацией, но так, чтобы внешний наблюдатель с ограниченными вычислительными ресурсами ничего не узнал), и так далее. 
Чтобы преодолеть барьер, связанный с P=NP, можно рассматривать некоторые ограниченные классы алгоритмов или специальные модели вычислений. Скажем, легко (и важно!) проанализировать, какие задачи могут быть решены алгоритмами без внешней памяти (конечные автоматы) - они соответствуют так называемым регулярным выражениями. Или, напротив, можно исследовать только какой-то один аспект вычислений - например, количество битов, которыми обмениваются участники (считая, что сами вычисления нам ничего не стоят, а сложна лишь передача битов). 
В целом, теория сложности вычислений расставляет (пусть не всегда и не везде) ориентиры для программиста - позволяя ему лучше рассчитать свои силы и понять, чего в принципе можно достичь и чего достичь нельзя
Draft Syllabus

6. Введение в теорию статистического обучения (преподается на английском языке)

Баувенс Бруно Фредерик Л.

Департамент больших данных и информационного поиска: Доцент

 
In this course we study the theoretical framework that inspired the development of two important families of machine learning algorithms: support vector machines and boosting. In a typical  classification task we are given (1) a dataset for training and (2) a set of classifiers [for example, neural networks of some size, or  polynomial threshold functions of some degree]. The learning algorithm should use the training dataset to select one of the classifiers from the set so that the selected function performs well according to some learning criteria. On one side, we want to have a large set of classifiers to model all structure in the training data. On the other hand a large set of predictors might lead to overfitting. In this course we learn how to quantify such errors and how to apply them on many machine learning algorithms. The bounds in turn, inspire new algorithms and we pay special attention to boosting algorithms such as AdaBoost and DeepBoosting. These algorithms are currently very successful in many application areas.

 Draft Syllabus

7. Анализ неструктурированных данных 

Черняк Екатерина Леонидовна

Департамент анализа данных и искусственного интеллекта: Доцент

 
! Студенты специализации "Машинное обучения и приложения" не выбирают этот курс, т.к. он включен в пул обязательных курсов специализации на 4м году обучения
В курсе рассматриваются актуальные задачи обработки естественного языка — как хорошо изученные (оценка окраса текста, определение частей речи, определение языка, анализ морфологии, обучение с учителем на текстах и другие), так и активно развивающиеся (суммаризация текста, диалоговые системы и чат-боты и т.д.). Также изучаются подходы к работе с неструктурированными источниками данных, извлечению из них информации и её хранению. Весь материал сопровождается практическими задачами анализа интернет-данных и больших текстовых корпусов.
Программа дисциплины


↑ вернуться