• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Статистические и эмпирические методы компьютинга

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус: Курс обязательный (Программная инженерия)
Направление: 09.03.04. Программная инженерия
Когда читается: 2-й курс, 3, 4 модуль
Формат изучения: Blended
Язык: английский
Кредиты: 5

Course Syllabus

Abstract

Настоящая программа учебной дисциплины «Статистические и эмпирические методы компьютинга» устанавливает минимальные требования к знаниям и умениям студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 09.03.04 «Программная инженерия» уровня бакалавра, изучающих дисциплину «Статистические и эмпирические методы компьютинга». В соответствии с учебным планом по направлению «Программная инженерия» дисциплина читается студентам второго курса бакалавриата в 3 и 4 модулях
Learning Objectives

Learning Objectives

  • формирование у студентов профессиональных компетенций, связанных с использованием методов теории вероятностей и математической статистики в области программной инженерии;
  • выработка практических навыков применения статистических и эмпирических методов;
  • получение студентами опыта самостоятельной исследовательской работы, предполагающей изучение специфических методов математической статистики, инструментов и средств, необходимых для решения прикладных задач.
Expected Learning Outcomes

Expected Learning Outcomes

  • Знать методы математической статистики
  • Знать методы анализа и обработки эмпирической информации
  • Уметь планировать экспериментальное исследование алгоритмического и программного обеспечения
  • Уметь оценивать программное обеспечение с использованием результатов обработки экспериментальных данных
  • Иметь навыки (приобрести опыт) и владеть инструментами построения графиков, диаграмм и гистограмм на основе полученных экспериментальных данных
  • Иметь навыки (приобрести опыт) и владеть методами и средствами обработки результатов эксперимента
  • Иметь навыки (приобрести опыт) и владеть методами и средствами прогнозирования характеристик ПО по экспериментальным результатам
  • Иметь навыки (приобрести опыт) и владеть методами разработки эффективных решений на основе сравнительного анализа экспериментальных результатов
Course Contents

Course Contents

  • Тема 1. Теория вероятностей. Основные понятия
    Математические и вероятностные модели. Испытания и события. Предмет теории вероятностей. Вероятностное пространство и вероятностная мера.
  • Тема 2. Дискретные случайные величины
    Случайные величины как действительнозначные функции на выборочном пространстве. Дискретные случайные величины с конечным и счетным носителями. Понятие функции распределения случайной величины. Законы распределения. Биномиальное и геометрическое распределения. Сходящиеся ряды и законы распределения. Точечные характеристики случайных величин, моменты и квантили.
  • Тема 3. Непрерывные случайные величины
    Определения непрерывной и абсолютно непрерывной случайной величины. Функция плотности распределения и функция распределения случайной величины. Интегральные формулы моментов для случайных величин, имеющих плотности. Нормальное распределение, бета распределение
  • Тема 4. Математическая статистика. Предмет и основная терминология
    Основные задачи математической статистики. Генеральная и выборочная совокупности. Понятие выборки. Репрезентативность. Теория планирования эксперимента.
  • Тема 5. Стандартная обработка выборки
    Оценки параметров распределения и требования к оценкам. Точечные оценки. Выборочное средне и выборочная исправленная дисперсия. Размах варьирования. Частота и гистограммирование.
  • Тема 6. Интервальные оценки параметров
    Оценки параметров распределения. Общая идея методов доверительных интервалов. Доверительная вероятность. Распределение оценки, параметризованное объемом выборки. Связь объема выборки, ширины интервала и доверительной вероятности. Доверительный интервал для выборочной средней при известной и неизвестной дисперсии. Распределение Стьюдента. Оценка необходимого объема выборки при заданной доверительной вероятности и ширине интервала в случаях известной и неизвестной дисперсии.
  • Тема 7. Проверка гипотез. Ошибки первого и второго рода
    Понятие гипотезы. Основная и альтернативные гипотезы. Понятие критерия. Общая схема проверки гипотез. Ошибки первого и второго рода. Взаимосвязь вероятностей ошибок. Условие принятия основной гипотезы. Наблюдаемое и критическое значения критерия проверки гипотезы.
  • Тема 8. Проверка гипотезы о равенстве математических ожиданий
    Конкретизация схемы проверки гипотез. Формулировка основной и альтернативной гипотезы. Односторонние и двусторонние критические области. Формулировка критерия проверки. Вычисление критических точек по заданной вероятности ошибки первого рода.
  • Тема 9. Критерии согласия. Постановка задачи
    Гипотезы о виде закона распределения. Множество предполагаемых дискретных или непрерывных распределений. Варианты меры различия функций на сегменте — чебышевская и интегральная меры. Требования к гистограммированию выборки. Экспериментальная и теоретическая гистограммы. Постановка задачи проверки гипотезы о виде закона распределения. Критерий согласия с интегральной мерой — критерий Пирсона. Распределение хи-квадрат. Особенности критерия Пирсона. Критерий согласия с чебышевской мерой — критерий Колмогорова. Распределение Колмогорова. Особенности критерия Колмогорова
  • Тема 10. Корреляционный анализ
    Исследование взаимовлияния двух случайных величин. Коэффициент корреляции. Интерпретация особых значений (-1, 0, 1) коэффициента корреляции. Основы факторного анализа. Выявление несущественных факторов методами корреляционного анализа.
  • Тема 11. Введение в регрессионный анализ
    Функциональные и стохастические зависимости. Понятие регрессии. Постановка задачи линейного регрессионного анализа. Меры расстояния от точки до прямой. Совокупная мера расстояния для множества точек — чебышевский и интегральный подходы. Чувствительность чебышевской меры к единичным выбросам.
  • Тема 12. Линейная регрессия. Метод наименьших квадратов
    Нахождение коэффициентов линейной регрессии как задача минимизации интегрального расстояния от множества точек выборки до прямой. Основная формула линейного регрессионного анализа. Матричная форма для расчета коэффициентов линейной регрессии. Понятие об эллипсе рассеяния. Метод главных компонент.
  • Тема 13. Нелинейная регрессия
    Сведение нелинейной регрессии к линейной. Вывод формулы коэффициентов нелинейной регрессии для квадратичной зависимости. Значимость коэффициентов регрессии. Прогнозирование поведения изучаемой величины. Выбор рациональной функции регрессии из заданного множества.
  • Тема 14. Многофакторный регрессионный анализ
    Введение в многофакторный анализ. Многомерная линейная регрессия. Матричное уравнение многомерной линейной регрессии. Корреляционная интерпретация коэффициентов многомерной линейной регрессии.
  • Тема 15. Элементы кластерного анализа
    Постановка задачи кластерного анализа. Варианты функций расстояния. Кластерное пространство и его связь с многофакторной регрессией. Обзор методов кластеризации. Понятия ядра кластера, межкластерного расстояния и качества кластеризации. Устойчивость кластеров в терминах стандартного отклонения.
  • Тема 16. Математическая статистика и программная инженерия
    Задачи программной инженерии в аспекте математической статистики. Прогнозирование времен выполнения программных реализаций алгоритмов. Исследование устойчивости алгоритмов по времени. Понятие информационной чувствительности алгоритмов и доверительной трудоемкости.
Assessment Elements

Assessment Elements

  • non-blocking Домашнее задание
    сдаётся в письменном виде и представляет собой обработку данных эксперимента с использованием изученных методов.
  • non-blocking Письменный экзамен
    В 2020 году проводится дистанционно. Перечень индивидуальных заданий (1) высылается на групповую почту и, по желанию, на индивидуальную почту студента, (2) выставляется в telegram-канале. Выполненные работы в сканированном виде отправляются на почту преподавателя и, по желанию, через telegram. Задания предоставляются в формате .pdf, так что от студентов требуются ПО для чтения файлов .pdf. Ссылка на telegram: https://t.me/joinchat/Q3J3ohSo5ewMxDRy195vEw
  • non-blocking Онлайн-курс
Interim Assessment

Interim Assessment

  • Interim assessment (4 module)
    0.4 * Домашнее задание + 0.3 * Онлайн-курс + 0.3 * Письменный экзамен
Bibliography

Bibliography

Recommended Core Bibliography

  • Теория вероятностей и математическая статистика - 2 (промежуточный уровень) : учеб. пособие, Шведов А. С., 2007

Recommended Additional Bibliography

  • Информационная чувствительность компьютерных алгоритмов, Петрушин В. Н., Ульянов М. В., 2010