• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Математические основы анализа данных

2020/2021
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 2-4 модуль

Преподаватели

Программа дисциплины

Аннотация

Курс «Математические основы анализа данных» читается на 1-ом курсе магистерской программы «Цифровые методы в гуманитарных науках». Формат изучения: без использования онлайн курсов. Изучение данной дисциплины базируется на знаниях и компетенциях, полученных при изучении следующих дисциплин: Математика (адаптационный курс). Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: «Цифровые гуманитарные науки» (1 курс), «Введение в науку о данных» (1 курс).
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство студентов со следующими разделами: теория графов, конечные выражения и регулярные языки, теория вероятностей и статистика, необходимых для изучения прикладных дисциплин и дальнейшего практического применения. Формирование у слушателей ясного представления о базисных понятиях и методах данных разделов.
  • Развитие логического мышления и умения оперировать абстрактными объектами, привитие навыков корректного математических понятий и символов для выражения различных количественных и качественных отношений.
  • Развитие навыка строгих математических рассуждений и доказательств.
Планируемые результаты обучения

Планируемые результаты обучения

  • Умение использовать формулу Байеса и формулу полной вероятности.
  • Умение использовать формулу Мувра-Лапласа и центральную предельную теорему и формулу для решения задач.
  • Владение методом максимального правдоподобия, критерием Стьюдента, критерием хи- квадрат Пирсона.
  • Понимание основных определений в теории графов, владение алгоритмом Дейкстры и алгоритмом Чу-Лю- Эдмондса.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1 Вероятность .
    Основные законы распределения случайных величин. Дискретные инепрерывные случайные величины. Числовые характеристики распределений: математическое ожидание, дисперсия и моменты старших порядков. Биномиальное и геометрическое распределения. Непрерывные распределения. Нормальное распределение на прямой. Распределение Пуассона. Совместное распределение случайных величин. Ковариация и коэффициент корреляции.
  • Тема 2 Предельные теоремы в теории вероятностей .
    Неравенство Чебышева. Локальная и интегральная теоремы Муавра-Лапласа, теорема Пуассона. Закон больших чисел в форме Бернулли. Центральная предельная теорема.
  • Тема 3 Статистика.
    Статистика и вероятность. Случайная выборка и ее объем. Эмпирическая функция распределения. Гистограмма и полигон. Выборочные моменты, мода и медиана. Выборочное среднее и выборочная дисперсия. Статистики и их выборочные распределения. Распределения хи-квадрат (Пирсона), Стьюдента и Фишера. Распределение выборочного среднего и выборочной дисперсии для нормальных выборок. Лемма Фишера. Доверительные интервалы для параметров нормального закона. Проверка гипотез о среднем и дисперсии для нормальных выборок. Постановка задачи оценивания параметров. Оценки параметров. Свойства оценок – несмещенность, состоятельность, асимптотическая нормальность, эффективность. Минимаксные и байесовские оценки. Методы построения точечных оценок. Метод моментов. Метод наибольшего (максимального) правдоподобия. Постановка задачи проверки гипотез. Статистический критерий. Основная и альтернативная гипотезы. Уровень значимости и мощность критерия. Проверка параметрических гипотез. Проверка непараметрических гипотез. Критерий согласия хи-квадрат Пирсона для простой и сложной гипотезы.
  • Тема 4 Теория графов .
    Понятие ориентированного и неориентированного графа. Полный граф. Степень вершины графа. Подсчёт количества рёбер в графе. Изоморфизм графов. Понятие пути и цикла в графе, связные графы, сильно связные ориентированные графы. Дерево и подсчёт количества рёбер в дереве. Остовное дерево. Понятие планарного графа. Формула Эйлера для планарных графов. Таблица смежности данного графа, вычисление количества путей длины n по таблице смежности. Алгоритм Дейкстры поиска кратчайшего пути. Алгоритм Борувки. Алгоритм Чу-Лю-Эдмондса и его применение в лингвистических задачах. Теория графов и социальные сети.
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
    Экзамен пройдет 20 июня c 12:00 до 14:30 на платформе Zoom. Понадобится компьютер с камерой, поддерживающий Zoom. Для участия в экзамене студент обязан включить камеру в Zoom. Демо версия экзамена доступна в приложении.
  • неблокирующий Контрольная работа
  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • неблокирующий Домашнее задание 4
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.15 * Домашнее задание 1 + 0.1 * Домашнее задание 2 + 0.1 * Домашнее задание 3 + 0.15 * Домашнее задание 4 + 0.2 * Контрольная работа + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Дискретная математика : курс лекций для студентов-механиков, Редькин, Н. П., 2006
  • Задачи и упражнения по дискретной математике : учеб. пособие, Гаврилов, Г. П., 2005
  • Задачник по теории вероятностей для студентов социально - гуманитарных специальностей, Макаров, А. А., 2015
  • Теория вероятностей : учебник для экономических и гуманитарных специальностей: учеб. пособие для вузов, Тюрин, Ю. Н., 2009

Рекомендуемая дополнительная литература

  • Графы и их применение, Оре, О., 2006
  • Графы и их применение, Оре, О., 2008