• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Analysis of Heterogeneous Data and Data Pattern Analysis

2021/2022
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
Department of Higher Mathematics (Independent HSE Departments)
Course type:
Compulsory course
When:
1 year, 3, 4 module

Instructors

Программа дисциплины

Аннотация

Чаще всего в социальных науках, в частности, в политологии, исследователям приходится работать с неоднородными данными. Примером могут выступать данные с панельной структурой (наличие как пространственного, так и временного измерения: данные по каждой стране из выборки представлены за несколько лет), с иерархической структурой (к примеру, в массиве представлены данные на индивидуальном и страновом уровне). В таком случае предположение об одинаковых параметрах для всех единиц анализа является неправдоподобным. Допустим, взаимосвязь между протестной активностью и доходом может быть разного характера в разных странах. Оценивание классической модели линейной регрессии в таком случае приводит к некорректным результатам статистической инференции. Курс «Методы анализа неоднородных данных и паттерн-анализ» посвящен изучению количественных методов, позволяющих учесть отсутствие независимости наблюдений в подгруппах выборки. Будут рассмотрены и критически проанализированы следующие методы: 1) корректировка с помощью робастных стандартных ошибок 2) регрессионный анализ на подвыборках 3) регрессионный анализ с включением переменных взаимодействия 4) моделирование с фиксированными эффектами 5) моделирование со смешанными эффектами, в частности, многоуровневое моделирование. Программное обеспечение – Python и RStudio. Преподавателем будут предложены конкретные исследования для обсуждения методологического подхода и соответствующие массивы данных для репликации результатов.
Цель освоения дисциплины

Цель освоения дисциплины

  • овладение статистическими методами, позволяющих учесть отсутствие независимости наблюдений в подгруппах выборки, для решения политологических и социально-экономических задач
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает возможные стратегии работы с неоднородными данными и знает их область применения, корректно применяет и интерпретирует оценки моделей с переменными взаимодействия
  • Корректно интерпретирует оценки коэффициентов в моделях со смешанными эффектами, понимает различие между фиксированными и случайными эффектами в контексте модели со смешанными эффектами
  • Корректно интерпретирует результаты оценивания модели с фиксированными эффектами, знает область применения модели с фиксированными эффектами
  • Умеет выбрать и обосновать спецификацию модели со смешанными эффектами для анализа панельных данных, корректно интерпретирует оценки коэффициентов в моделях со смешанными эффектами
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение: основы работы с гетерогенной выборкой
  • Модели с фиксированными эффектами: возможности и ограничения
  • Модели со смешанными эффектами. Сравнение альтернативных подходов к работе с гетерогенной выборкой
  • Анализ панельных данных при помощи моделей со смешанными эффектами
  • Методы анализа паттернов
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Самостоятельные работы
  • неблокирующий Эссе
  • неблокирующий Презентация эссе
  • неблокирующий Экзаменационная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.2 * Домашние задания + 0.25 * Эссе + 0.15 * Самостоятельные работы + 0.3 * Экзаменационная работа + 0.1 * Презентация эссе
Список литературы

Список литературы

Рекомендуемая основная литература

  • Bradford S. Jones, & Marco R. Steenbergen. (1997). Modeling Multilevel Data Structures. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.F4700E2E
  • Econometric analysis of cross section and panel data, Wooldridge, J. M., 2002
  • Анализ панельных данных и данных о длительности состояний : учеб. пособие, Ратникова, Т. А., 2014

Рекомендуемая дополнительная литература

  • Green, D. P., Kim, S. Y., & Yoon, D. H. (2001). Dirty Pool. International Organization, (02), 441. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsrep&AN=edsrep.a.cup.intorg.v55y2001i02p441.468.44
  • Hainmueller, J., Mummolo, J., & Xu, Y. (2019). How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice. Political Analysis, (02), 163. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsrep&AN=edsrep.a.cup.polals.v27y2019i02p163.192.00