• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2019/2020

Анализ категориальных данных в статистических пакетах

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс по выбору (Политология)
Направление: 41.03.04. Политология
Когда читается: 3-й курс, 3, 4 модуль
Формат изучения: Full time
Язык: русский
Кредиты: 5

Программа дисциплины

Аннотация

Освоение дисциплины «Анализ категориальных данных в статистических пакетах» позволяет получить базовые знания и навыки по применению ряда популярных методов к решению задач, связанных с анализом эмпирических данных, в том случае, когда зависимая переменная измерена в порядковой или номинальной шкале. Например, для изучения того, какие индивидуальные характеристики могут повлиять на то, ходит ли человек на выборы, за кого он голосует. Курс охватывает модели бинарного выбора, модели множественного выбора с упорядоченным откликом (порядковая логистическая регрессия), а также мультиномиальные регрессионные модели. На занятиях используется RStudio для отработки применения изученных методов.
Цель освоения дисциплины

Цель освоения дисциплины

  • Выработка компетенций по решению политологических и социально-экономических задач, связанных с анализом данных в том случае, когда изучаемые зависимые признаки имеют дискретную природу.
Планируемые результаты обучения

Планируемые результаты обучения

  • уметь применять основные модели бинарного и множественного выбора, уметь корректно интерпретировать и визуализировать результаты их оценивания
  • владеть навыками реализации моделей бинарного и множественного выбора в статистических пакетах (Rstudio)
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1.1 Линейная модель регрессии
    Дискретные зависимые переменные. Латентный признак и наблюдаемые исходы. Линейная вероятностная моделью
  • 1.2. Логистическая регрессия
    Оценивание моделейс дискретными зависимыми переменными. Метод максимального правдоподобия (ММП). Модели бинарного выбора: логистическая регрессия (логит-модель) и пробит-модель. Условия на ошибки моделей бинарного выбора. Интерпретация коэффициентов логистической регрессии при непрерывных и категориальных переменных. Шансы и отношения шансов. Предсказанные вероятности. До верительные интервалы. Графическое представление результатов. Сравнение коэффициентов логит - и пробит-моделей.
  • 1.3. Проверка гипотез.
    Проверка гипотез о линейных ограничениях на коэффициенты: тест Вальда, тест отношения правдоподобия. Проверка гипотез об адекватности модели (критерии качества модели), сравнение моделей. (pseudo-R2, AIC, BIC). Анализ остатков модели. Выявление нетипичных наблюдений.
  • 2. Модели множественного неупорядоченного выбора.
    Номинальные переменные. Мультиномиальная логистическая регрессия. Интерпретация коэффициентов мультиномиальной логистической регрессии. Условная логистическая регрессия (Conditional logit). Предположение о независимости от посторонних альтернатив.
  • 3. Модели множественного упорядоченного выбора.
    Порядковые переменные. Порядковая логистическая регрессия. Оценивание порядковой логистической регрессии. Интерпретация коэффициентов порядковой логистической регрессии. Предположение о параллельности регрессий: тест Бранта. Обобщенная модель множественного упорядоченного выбора (Generalized ordered logit) / частичная модель пропорциональных шансов (Partial proportional odds model).
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Самостоятельные работы
  • неблокирующий Эссе
  • неблокирующий Контрольная работа
  • неблокирующий Экзаменационная работа
    Экзамен проводится в форме теста с открытыми и закрытыми ответами и выполнения практических заданий в R с последующей интерпретацией результатов. Экзамен проводится на платформе GoogleForms (https://docs.google.com/forms/). На компьютере должны быть установлены R и RStudio. Во время экзамена студентам запрещено общаться (в социальных сетях, с людьми в комнате). Во время экзамена разрешено пользоваться любыми материалами и конспектами. Кратковременным нарушением связи считается любое нарушение связи до 15 минут. Если студент не успевает сдать задание до дедлайна в случае кратковременного нарушения связи, то студенту в этот же день дается другое задание. Долговременным нарушением связи считается нарушение, не позволяющее студенту отправить форму в срок (от 15 минут). О кратковременном и долговременном нарушении связи студент должен сообщить преподавателю. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.15 * Домашние задания + 0.15 * Контрольная работа + 0.15 * Самостоятельные работы + 0.3 * Экзаменационная работа + 0.25 * Эссе
Список литературы

Список литературы

Рекомендуемая основная литература

  • Прикладная статистика и основы эконометрики : Учебник для вузов, Айвазян С. А., Мхитарян В. С., 1998

Рекомендуемая дополнительная литература

  • Путеводитель по современной эконометрике : учеб. пособие для вузов, Вербик М., Банникова В. А., 2008