• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Экономика и статистика»

Многомерные статистические методы

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты
Статус:
Курс обязательный
Когда читается:
3-й курс, 1, 2 модуль

Преподаватели

Программа дисциплины

Аннотация

Целью курса многомерные статистические методы является изучение основных направлений развития современного многомерного статистического инструментария, включая методы корреляционно-регрессионного анализа, снижения размерности признакового пространства, классификации объектов, среди которых иерархические и итерационные алгоритмы кластерного анализа, параметрическая и непараметрическая классификация, деревья решений и случайные леса. Важной особенностью курса является широкое использование наглядных примеров и применение широкого арсенала современных средств обработки статистической информации (например, в ППП SPSS, средах R, Python), освобождающих исследователя от вычислительной рутины и позволяющих превратить статистическое исследование в увлекательное занятие.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины "Многомерные статистические методы" является - ознакомление с основными направлениями развития и освоение современных многомерных статистических методов, получение навыков их практического применения для анализа социально-экономических процессов и явлений, - выработка компетенций, необходимых для успешного применения рассматриваемого инструментария при решении профессиональных задач анализа социально-экономических процессов и явлений. Ценностью учебной дисциплины являются навыки анализа данных (data mining) с использованием современных программных систем и сред.
Планируемые результаты обучения

Планируемые результаты обучения

  • Собирает информацию из разных источников, Проводит предварительный анализ данных, Изучает связи между переменными в многомерном пространстве с использованием современных программных продуктов
  • Строит многомерные регрессионные модели. Проводит верификацию модели. Строит интервальные оценки
  • Проводит снижение признакового пространства с использованием метода главных компонент. Строит уравнение регрессии на главных компонентах
  • Проводит класстеризацию многомерных наблюдений с использованием иерархических и итеративных алгоритмов кластерного анализа. Строит и интерпретирует дендрограммы.
  • Использует дскриминантный анализ для кластеризации новых объектов. Строит дискриминантные функции, интерпретирует межгрупповые различия. Выбирает показатели, обладающие наибольшей дискриминирующей силой
  • Проводит кластеризацию объектов с использованием деревьев решений
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Предмет, содержание, задачи курса. Предварительный и корреляционного анализа
    Связь теории вероятностей, математической статистики и многомерных статистических методов (МСМ). Задачи МСМ в области социально-экономических исследований и процессов. Использование ППП в задачах МСМ. Генеральная и выборочная совокупности. Задачи оценивания. Многомерное нормальное распределение, как основная модель современных многомерных методов. Основные типы и формы представления исходных данных. Проблема размерности в многомерных методах исследования. Многомерные методы оценивания и статистического сравнения. Основы корреляционного анализа. Двумерная корреляционная модель Основные измерители линейной статистической связи между объектами. Точечные и интервальные оценки параметров двумерной корреляционной модели. Корреляционное облако. Проверка значимости параметров связи. Трехмерная корреляционная модель Частный и множественный коэффициенты корреляции и их свойства. Множественный коэффициент детерминации и его свойства. Проверка значимости параметров связи. Построение доверительных интервалов параметров связи.
  • Основы регрессионного анализа. Двумерная и многомерная регрессионные модели
    Основные понятия, задачи и предпосылки регрессионного анализа. Нормальный закон распределения и его свойства. Двумерная линейная регрессионная модель. Оценка уравнения регрессии Y на X. Оценка остаточной дисперсии σ2. Многомерная регрессионная модель и оценка ее коэффициентов. Пошаговые алгоритмы регрессионного анализа. Метод наименьших квадратов (МНК) для нахождения оценок коэффициентов уравнения регрессии. Статистические свойства оценок параметров, полученных методом наименьших квадратов. Верификация моделей. Проверка адекватности и точности построенных моделей регрессии. Гипотезы о значимости коэффициентов регрессии и уравнения регрессии в целом. Исследований свойств остатков модели и их соответствия требованиям классической линейной регрессионной модели (КЛРМ). Доверительные интервалы и интервалы предсказания для коэффициентов и уравнения регрессии. Коэффициент детерминации и его свойства. Скорректированный коэффициент детерминации, его свойства и особенности использования в эконометрических исследованиях. Прогнозирование с помощью регрессионной модели. Нелинейные регрессионные модели и их характеристики. Примеры использования линейных и нелинейных регрессионных моделей в современных задачах анализа данных.
  • Методы снижения размерности. Компонентный анализ и основы факторного анализа
    Модель, математическое обоснование и алгоритм метода главных компонент. Собственные векторы и собственные значения корреляционной матрицы и их использование для получения матрицы факторных нагрузок. Основные числовые характеристики главных компонент. Вычисление, свойства и назначение матрицы нормированных значений главных компонент. Особенности ее использования при построении регрессии на главные компоненты. Применение метода главных компонент в экономических и социологических исследованиях. Сущность и общий вид линейной модели факторного анализа, ее связь и отличие от модели компонентного анализа. Реализация методов факторного и компонентного анализа в ППП SPSS.
  • Классификация многомерных наблюдений. Кластерный анализ
    Основные понятия кластерного анализа. Методы классификации без обучения. Расстояния между объектами. Меры близости между кластерами. Классификация признаков на основе матриц коэффициентов статистической связи между ними. Функционалы качества разбиения. Основные типы задач и алгоритмов кластерного анализа. Иерархические кластер процедуры. Параллельные и последовательные кластер-процедуры. Метод к-средних. Зависимость выбора метода классификации от цели исследования.
  • Классификация многомерных наблюдений с обучением. Основы дискриминантного анализа
    Основные понятия дискриминантного анализа. Методы классификации с обучением. Обучающие выборки. Линейный дискриминантый анализ при известных параметрах многомерного нормального закона распределения. Вероятность ошибочной классификации с помощью дискриминантной функции. Оценка качества дискриминантной функции и информативности отдельных признаков. Методы дискриминантного анализа в ППП SPSS.
  • Деревья решений, случайные леса
    Основные понятия и определения деревьев классификации и случайных лесов (classification trees», или «decision trees). Области применения деревьев классификации и случайных лесов. Преимущества и недостатки использования деревьев решений. Правила построения деревьев решений. Критерии останова. Стрижка деревьев (Rruning). Функционалы качества. Критерий Джини и энтропийный критерий. Понятие регуляризации. Валидация и кроссвалидация. Композиции деревьев (случайный лес). Алгоритм CART и алгоритм ID3
Элементы контроля

Элементы контроля

  • неблокирующий компьютерная работа
  • неблокирующий квиз
  • неблокирующий эссе
  • неблокирующий контрольная работа №1
  • неблокирующий Контольная работа №2
  • неблокирующий активность на занятиях
  • неблокирующий самостоятельная работа
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.2 * активность на занятиях + 0.1 * квиз + 0.15 * компьютерная работа + 0.15 * Контольная работа №2 + 0.2 * контрольная работа №1 + 0.1 * самостоятельная работа + 0.1 * эссе
Список литературы

Список литературы

Рекомендуемая основная литература

  • Груздев А.В. - Прогнозное моделирование в IBM SPSS Statistics и R: Метод деревьев решений - Издательство "ДМК Пресс" - 2016 - 278с. - ISBN: 978-5-97060-456-4 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93280
  • Груздев А.В. - Прогнозное моделирование в IBM SPSS Statistics, R и Python: метод деревьев решений и случайный лес - Издательство "ДМК Пресс" - 2018 - 642с. - ISBN: 978-5-97060-539-4 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/123700
  • Корреляция мер по противодействию коррупции с причинами и условиями ее возникновения : науч.-метод. пособие / Е.И. Добролюбова, А.В. Павлушкин, Э.Л. Сидоренко [и др.] ; под ред. В.Н. Южакова, А.М. Цирина. — М. : Институт законодательства и сравнительного правоведения при Правительстве Российской Федерации : ИНФРА-М, 2017. — 156 с. — www.dx.doi.org/10.12737/18664. - Режим доступа: http://znanium.com/catalog/product/767949
  • Методы эконометрики: Учебник / С.А. Айвазян; Московская школа экономики МГУ им. М.В. Ломоносова (МШЭ). - М.: Магистр: ИНФРА-М, 2010. - 512 с.: 70x100 1/16. (переплет) ISBN 978-5-9776-0153-5 - Режим доступа: http://znanium.com/catalog/product/196548
  • Прикладная статистика и основы эконометрики : учебник для вузов, Айвазян, С. А., 1998
  • Эконометрика - 2: продвинутый курс с приложениями в финансах: Учебник / С.А. Айвазян, Д. Фантаццини; Московская школа экономики МГУ им. М.В. Ломоносова (МШЭ). - М.: Магистр: НИЦ ИНФРА-М, 2014. - 944 с.: 70x100 1/32. (переплет) ISBN 978-5-9776-0333- - Режим доступа: http://znanium.com/catalog/product/472607

Рекомендуемая дополнительная литература

  • Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
  • Воскобойников Ю.Е. - Эконометрика в Excel: парные и множественные регрессионные модели: учебное пособие - Издательство "Лань" - 2018 - 260с. - ISBN: 978-5-8114-2318-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/108319
  • Корреляция мер по противодействию коррупции с причинами и условиями ее возникновения: Науч.-методич. пос. / Добролюбова Е.И., Павлушкин А.В., Сидоренко Э.Л.; Под ред. Южакова В.Н.-М.:НИЦ ИНФРА-М,2016-156с:60x90 1/16.(ИЗиСП)(П) ISBN 978-5-16-012086-7 - Режим доступа: http://znanium.com/catalog/product/553315
  • Прикладной многомерный статистический анализ: Презентации для лекций и примеры решений с использованием пакета R: Учебное пособие на английском языке / Зарова Е.В. - М.:НИЦ ИНФРА-М, 2016. - 370 с.: 60x90 1/16 (Обложка) ISBN 978-5-16-012133-8 - Режим доступа: http://znanium.com/catalog/product/557578
  • Яковлев В.Б. - Регрессионный анализ. Расчеты в Excel и Statistica. Учебное пособие - Русайнс - 2018 - 176с. - ISBN: 978-5-4365-2727-7 - Текст электронный // ЭБС BOOKRU - URL: https://book.ru/book/930268