• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Прикладной статистический анализ

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты
Статус:
Курс по выбору
Когда читается:
2-й курс, 1, 2 модуль

Преподаватели

Программа дисциплины

Аннотация

Дисциплина «Прикладной статистический анализ» преследует следующие цели: помочь студентам сориентироваться в многообразии методов статистического анализа данных и научиться корректно применить выбранные методы. Наряду с уже известными методами статистического анализа (таблицы сопряженности, корреляционный и регрессионный анализ и т.д.) в ходе обучения будут представлены новые методы анализа, не встречавшиеся в предыдущих дисциплинах: модели деревьев решений, event history analysis, sequence analysis и другие методы. Отдельный фокус будет сделан на анализе биографических событий (микроданные) и способах визуализации результатов. Курс носит прикладной, практический характер. Он поможет структурировать ранее полученные знания, усовершенствовать навыки работы в таких программах как IBM SPSS, R, MS Excel, MS Word. В рамках курса предполагается выполнение двух домашних заданий и двух контрольных работ. Итоговый экзамен отсутствует. Оценка за курс выставляется на основании оценок за указанные работы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Помочь студентам сориентироваться в многообразии методов статистического анализа данных и корректно применить выбранные методы
  • Структурировать ранее полученные знания, усовершенствовать навыки работы в таких программах как SPSS, R, MS Excel, MS Word
  • Расширить навыки визуализации результатов статистического анализа
  • Освоение методов анализа наступления биографических событий жизни
Планируемые результаты обучения

Планируемые результаты обучения

  • Способен(а) строить таблицы сопряженности, содержащие различные виды относительных частот
  • Способен(а) выбрать подходящий метод поиска связи между двумя признаками в зависимости от типа шкал
  • Понимает разницу между типами связи и характеристиками связи, которые можно установить с помощью критерия "хи-квадрат" и коэффициентов ранговой корреляции
  • Умеет рассчитывать в SPSS и интерпретировать значения критерия "хи-квадрат", коэффициентов ранговой корреляции Спирмена и Кендалла;
  • Понимает разницу между условиями применения методов параметрической и непараметрической статистики;
  • Умеет реализовать в пакете SPSS и интерпретировать результаты основных методов непараметрических сравнений (тесты Манна-Уитни и Вилкоксона, дисперсионный анализ Каскла-Уоллиса)
  • Умеет выбирать регрессионную модель в зависимости от типа шкалы зависимой переменной;
  • Знает особенности построения регрессионных моделей для категориальных переменных
  • Может самостоятельно построить с помощью пакета SPSS, оценить качество и проинтерпретировать модель бинарной и мультиномиальной логистической регрессии с фиктивными переменными и без.
  • Умеет прогнозировать (рассчитывать вероятность) наступление некоторого события на основе регрессионной модели
  • Знает суть основных алгоритмов деревьев классификации: CHAID, CRT, QUEST
  • Умеет строить модели деревьев классификации (CHAID, CRT,QUEST) с помощью пакета SPSS
  • Умеет интерпретировать модели деревьев классификации и оценивать их качество
  • Умеет устанавливать R и RStudio.
  • Знает основные правила написания команд
  • Умеет реализовать с помощью R простейшие методы анализа: частотные распределения, таблицы сопряженности, основные графики, коэффициенты парной связи.
  • Умеет ориентироваться в многообразии методов анализа данных
  • Понимает разницу между способом отображения данных "Person-Level Data" и "Person-Period Data"
  • Умеет интерпретировать хронограммы, являющиеся способом визуализации последовательностей наступления событий
  • Понимает отличие анализа последовательностей наступления событий от анализа наступления событий
  • Умеет проводить анализ наступления событий как через интерфейс IBM SPSS, так и посредством синтаксиса
  • Может проинтерпретировать регрессионные коэффициенты в моделях (регрессии Кокса) и сопоставить их с графиками выживаемости
  • Умеет строить регрессии Кокса и делать оценки Каплана-Майера и интерпретировать полученные результаты
  • Умеет осуществлять анализ наступления событий в IBM SPSS
  • Умеет визуализировать события жизненного пути в разных программах: MS Word, MS Excel, IBM SPSS и др.
  • Различает разницу между эффектами периода, возраста и когорты
  • Умеет располагать события жизненного пути на сетку Лексиса
  • Умеет применять сетку Лексиса и пользоваться как ее аналитическим потенциалом, так и математической составляющей
  • Знает, какие методы входят в инструментарий концепции жизненного пути и для каких целей используется каждый из методов
  • Знает основные термины концепции жизненного пути: событие, статусный переход, статусный пассаж, траектория, жизненный сценарий, биография
  • Понимает разницу между терминами "время жизни", "жизненный цикл" и "жизненный путь"
  • Владеет корпусом теоретических знаний о концепции жизненного пути
  • Умеет выбрать подходящий метод анализа и знает при помощи каких статистических пакетов его осуществлять
  • Понимает, чем отличается анализ агрегированных данных от индивидуальных данных (микроданных)
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема № 1. Анализ двумерной связи между номинальными и порядковыми переменными. Критерий «хи-квадрат», коэффициенты ранговой корреляции
    Таблицы сопряженности. Возможное содержание ячеек таблицы. Условные и безусловные частоты. Коэффициенты парной связи для различных типов шкал. Критерий Хи-квадрат и основанные на нем коэффициенты. Коэффициенты ранговой корреляции Спирмена и Кендалла.
  • Тема №2. Базовые методы непараметрических сравнений
    Различия параметрической и непараметрической статистики. Достоинства и недостатки непараметрических методов, по сравнению с параметрическими. Непараметрические аналоги некоторых параметрических методов: одновыборочный тест знаков (непараметрический аналог одновыборочного Т-теста), тесты суммы рангов Манна –Уитни и Вилкоксона (непараметрические аналоги Т-теста для независимых выборок), тест приписанных знаков рангов Вилкоксона (непараметрический аналог Т-теста для связанных выборок) и непараметрический дисперсионный анализ Краскла-Уоллиса (непараметрический аналог однофакторного дисперсионного анализа)
  • Тема №3. Логистическая регрессия (бинарная и мультиномиальная)
    Бинарная логистическая регрессия Регрессионные модели для бинарных зависимых переменных. Модель линейной вероятности. Логистическая регрессия. Интерпретация коэффициентов логистической регрессии. Шансы и отношения шансов. Мультиномиальная логистическая регрессия. Представление зависимой переменной в мультиномиальной логистической регрессии. Выбор контрольных групп. Интерпретация коэффициентов уравнения мультиномиальной логистической регрессии. Ограничения мультиномиальной логистической регрессии
  • Тема №4. Модели деревьев классификации (деревьев решений).
    Модели деревьев решений. Особенности работы алгоритмов CHAID и CRT. Ошибки классификации, определение понятия риска. Проверка качества модели, способы решения проблемы излишней подгонки дерева: кросс-проверка, V-кратная кросс-проверка.
  • Тема №5. Работа со статистическим пакетом R
    Интерфейс пакета R и оболочки RStudio. Установка R и RStudio. Скачивание библиотек. Основные правила написания команд. Реализация в R основных методов анализа данных.
  • Тема №6. Методы анализа биографических данных в общей структуре методов
    Обзор источников и видов данных (количественные и качественные; агрегированные и индивидуальные). Классификация методов анализа данных.
  • Тема №7. Концепция жизненного пути и ее инструментарий
    Концепция жизненного пути: истоки, развитие и перспективы применения. Базовые определения концепции: жизненный путь, статусный переход, статусный пассаж и другие. Структура методов анализа событий жизненного пути
  • Тема №8. Способы визуализации событий жизни: сетка Лексиса и другие инструменты
    Сетка Лексиса: ее аналитический и математический потенциал применения для анализа и визуализации наступления событий. APC-analysis: разделение эффектов периода, возраста и когорты. Способы визуализации наступления событий в разных компьютерных программах
  • Тема №9. Анализ наступления событий (Event history analysis)
    Комплекс методов анализа наступления событий: таблицы смертности, метод Каплана-Майера, регрессия Кокса: теоретическая основа и практика в IBM SPSS
  • Тема №10. Анализ последовательностей наступления событий (Sequence analysis)
    Различие подходов при анализе отдельных событий и последовательности событий. Разница между способом отображения данных "Person-Level Data" и "Person-Period Data". Визуализация последовательностей событий: хронограммы и другие инструменты.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание "Деревья классификации"
    Вес в итоговой оценке-25%
  • неблокирующий Домашнее задание "Выбор метода решения исследовательской задачи"
    Вес в итоговой оценке-25%
  • неблокирующий Контрольная работа "Сетка Лексиса"
    Вес в итоговой оценке-25%
  • неблокирующий Домашнее задание "Event history analysis"
    Вес в итоговой оценке-25%
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.25 * Домашнее задание "Event history analysis" + 0.25 * Домашнее задание "Выбор метода решения исследовательской задачи" + 0.25 * Домашнее задание "Деревья классификации" + 0.25 * Контрольная работа "Сетка Лексиса"
Список литературы

Список литературы

Рекомендуемая основная литература

  • SPSS 19: профессиональный статистический анализ данных, Наследов, А., 2011
  • Анализ социологических данных : методология, дескриптивная статистика, изучение связей между номинальными признаками : учеб.пособие для вузов, Толстова, Ю. Н., 2000
  • Анализ социологических данных с помощью пакета SPSS : учеб. пособие для вузов, Крыштановский, А. О., 2006

Рекомендуемая дополнительная литература

  • Демография : учеб. пособие для вузов, Денисенко, М. Б., 2007
  • Демография : учеб. пособие для вузов, Денисенко, М. Б., 2010
  • Практическая бизнес - статистика, Сигел, Э. Ф., 2004