• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Математическая статистика и анализ данных (проектный курс)

2025/2026
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты
Статус:
Курс по выбору
Когда читается:
3-й курс, 3, 4 модуль

Преподаватели

Программа дисциплины

Аннотация

Дисциплина «Математическая статистика и анализ данных: проектный курс» ориентирована на студентов, уже владеющих базовыми инструментами анализа данных, математической статистики и программирования. В отличие от классического курса, построенного вокруг последовательного изучения тем, дисциплина реализуется в формате проектного трека: студенты выбирают исследовательскую задачу, работают над ней под руководством преподавателя и в течение курса проходят несколько этапов — от постановки проблемы и обзора литературы до реализации метода, анализа результатов и защиты проекта. Тематика проектов находится на стыке математической статистики, анализа данных, топологического анализа данных, анализа сложных сетей, временных рядов, теории графов, представлений колчанов и анализа современных ML-моделей.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель дисциплины — сформировать у студентов опыт самостоятельной исследовательской работы в области математической статистики и анализа данных: от постановки задачи и выбора методов до программной реализации, анализа результатов и публичной защиты проекта.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать методы математической статистики, применимые к эмпирическим и модельным данным.
  • Знать базовые принципы проверки статистических гипотез, оценки параметров и анализа зависимостей
  • Знать подходы к анализу графов, временных рядов, изображений, матриц внимания и сложных систем
  • Знать требования к воспроизводимому исследованию: структура кода, документация, хранение данных, интерпретация результатов
  • Уметь выбирать методы анализа данных в зависимости от типа объекта: временной ряд, граф, изображение, матрица внимания, категория/колчан
  • Уметь проводить вычислительные эксперименты и интерпретировать их результаты
  • Уметь проверять статистические гипотезы и критически оценивать выводы
  • Уметь готовить академический отчет и презентацию проекта
  • Владеть навыками работы с Python/R или иными инструментами анализа данных
  • Владеть навыками построения исследовательского пайплайна
  • Владеть навыками визуализации и интерпретации результатов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1.
  • Тема 2.
    Типы данных и объектов: графы, изображения, временные ряды, матрицы внимания, категориальные структуры, колчаны. Источники данных. Очистка, хранение и документирование данных. Требования к воспроизводимости: структура репозитория, ноутбуки, скрипты, README, фиксация версий библиотек.
  • Тема 3.
  • Тема 4.
  • Тема 5.
  • Тема 6.
  • Тема 7.
  • Тема 8.
Элементы контроля

Элементы контроля

  • неблокирующий КТ₁
    Первая контрольная точка: постановка задачи, обзор литературы, план исследования
  • неблокирующий КТ₂
    Вторая контрольная точка: промежуточные результаты, реализация метода, анализ ограничений и план финальной доработки
  • неблокирующий Проект
    Требования к итоговому проекту: К защите студент представляет: 1. итоговый отчет; 2. презентацию; 3. код или программную реализацию; 4. данные или описание способа их получения; 5. результаты вычислительных экспериментов; 6. описание ограничений проекта и возможных направлений продолжения работы. Итоговый проект должен демонстрировать не только техническую реализацию, но и исследовательскую логику: зачем выбран данный метод, какие гипотезы проверяются, какие выводы можно сделать и где находятся границы применимости результата.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    Формула: [ О_{курс} = 0{,}5 \times КТ_1 + 0{,}5 \times КТ_2 ] где: • КТ₁ — первая контрольная точка: постановка задачи, обзор литературы, план исследования; • КТ₂ — вторая контрольная точка: промежуточные результаты, реализация метода, анализ ограничений и план финальной доработки.
Список литературы

Список литературы

Рекомендуемая основная литература

  • 9780199206650 - Newman, Mark - Networks : An Introduction - 2010 - Oxford University Press - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=458550 - nlebk - 458550
  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Network science, Barabasi, A.-L., 2019
  • The elements of statistical learning : data mining, inference, and prediction, Hastie, T., 2017
  • Wasserman, L. All of nonparametric statistics. – Springer Science & Business Media, 2006. – 270 pp.
  • Анализ социологических данных с помощью пакета SPSS : Учеб. пособие для вузов, Крыштановский, А. О., 2007
  • Прикладная статистика. Основы эконометрики. Т.1: Теория вероятностей и прикладная статистика, Айвазян, С. А., 2001
  • Прикладные методы анализа статистических данных : учеб. пособие, Горяинова Е.Р., Панков А.Р., 2012
  • Теория вероятностей и математическая статистика, Колданов, А. П., 2023

Рекомендуемая дополнительная литература

  • 9780387217369 - Larry Wasserman - All of Statistics : A Concise Course in Statistical Inference - 2010 - Springer - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2544135 - nlebk - 2544135

Авторы

  • Рословцева Кристина Олеговна
  • Борман Марина Юрьевна
  • Сафарян Анастасия Романовна