Бакалавриат
2018/2019
Количественные методы в политических исследованиях
Статус:
Курс по выбору (Политология и мировая политика)
Направление:
41.03.04. Политология
Где читается:
Санкт-Петербургская школа социальных наук
Когда читается:
2-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Турченко Михаил Сергеевич
Язык:
русский
Кредиты:
5
Контактные часы:
60
Программа дисциплины
Аннотация
Настоящая дисциплина относится к блоку дисциплин «Базовая профильная часть». Изучение данной дисциплины базируется на следующих дисциплинах: Математика и статистика; Сравнительная политика; Научно-исследовательский семинар (первый и второй годы обучения).
Цель освоения дисциплины
- формирование у студентов представления о познавательных возможностях количественных методов анализа данных в политологических исследованиях
- приобретение студентами знаний, умений и навыков, необходимых для сбора количественных данных и их визуализации; сравнения различных наборов данных при помощи статистических тестов; изучения взаимосвязей внутри количественных данных с помощью базовых статистических инструментов
- приобретение студентами навыков, необходимых для работы со специализированными статистическими программами, в частности, со статистической средой R
Планируемые результаты обучения
- Студент демонстрирует способность использовать подходящие методы для извлечения, сбора, обобщения, тестирования и анализа статистических данных
- Студент демонстрирует способность искать и собирать данные, а также соотносит качество и содержание данных со стоящими перед ним исследовательскими целями
- Студент демонстрирует способность анализировать и понимать суть научных исследований, в которых используются количественные методы
- Студент соотносит методы количественного анализа с типом и характеристиками располагаемых им данных
- Студент умеет собирать, систематизировать и оценивать данные; сохранять результаты анализа данных: скрипты, диаграммы, таблицы
Содержание учебной дисциплины
- Введение в дисциплину. Основы работы с RЛекция 1. Введение в содержание курса: формы текущего и итогового контроля знаний, порядок формирования накопленной и результирующей оценок. Обзор основной литературы по курсу. Место количественных методов в современных политологических исследованиях. Лекция 2. Специализированные статистические программы: виды, примеры, плюсы и минусы разных программ. Алгоритм установки и запуска статистической среды R и R-Studio. Обзор интерфейса статистической среды R и R-Studio. Основные команды, объекты и функции в R. Семинар 1. Запуск R-Studio. Обзор интерфейса R-Studio. R как калькулятор. Загрузка и запуск статистических пакетов. Сохранение результатов работы. Открытие сохраненных скриптов. Выход из программы. Семинар 2. Объекты и функции в R. Оператор присваивания. Способы ввода данных в R: функция c(). Подготовка данных к импорту в R из Excel: функция read.csv(), а также read_excel() из пакета readxl. Импорт данных в R из других статистических программ: пакет foreign и функции read.spss(), read.dta() и др. Работа с загруженными данными: функции attach() и detach(), команда $, извлечение отдельных данных из массива. Создание таблиц и работа с ними.
- Основные статистические понятия и введение в описательную статистикуЛекция 3. Генеральная совокупность и выборка. Типы данных. Описательная статистика: меры центральной тенденции и меры разброса. Нормальное распределение и центральная предельная теорема. Семинар 3. Способы расчета описательной статистики в R. Работа с данными из конкретного политологического исследования.
- Визуализация данных: принципы, инструменты, примерыЛекция 4. Роль визуализации данных в представлении результатов научного исследования. Принципы визуализации данных. Типы диаграмм: диаграмма рассеяния, диаграмма распределения (гистограмма), диаграмма размахов (боксплот), скрипичная диаграмма, столбчатая диаграмма, круговая диаграмма. Примеры диаграмм из политологических исследований. Семинары 4-5. Рассмотрение функций для создания различных типов диаграмм: plot(), hist(), boxplot(), vioplot(), barplot(), pie(). Рассмотрение функций для корректировки параметров диаграмм: par(), title(), lines(), legend(). Сохранение диаграмм в разных форматах и с разным разрешением. Работа с пакетом ggplot2.
- Введение в индуктивную статистику. Статистические тестыЛекция 5. Статистические гипотезы: альтернативная и нулевая. Статистические ошибки: первого и второго родов. Статистическая значимость. Лекция 6. Статистика хи-квадрат и ее разновидности. Вычисление хи-квадрата вручную. Примеры использования статистики хи-квадрат в политологических исследованиях. Лекция 7. Биномиальный тест. Сравнение выборок: общее представление о статистических тестах (параметрические – непараметрические; двусторонние – левосторонние – правосторонние). Параметрические тесты: t-тест для независимых и парных выборок. Непараметрические тесты: тест Вилкоксона (Манна-Уитни) для независимых и парных выборок. Тест Шапиро-Уилкса для проверки нормальности распределения. Иллюстрация работы статистических тестов. Семинар 6. Расчет в R статистики хи-квадрат. Работа с электоральной статистикой: сравнение результатов голосования за разные партии на разных УИКах в ЕДГ-2016. Семинар 7. Расчет биномиального теста, t-теста, теста Вилкоксона (Манна-Уитни), теста Шипиро-Уилкса. Работа с электоральной статистикой: сравнение значений разных индексов ЭЧП.
- Корреляция и ковариацияЛекция 8. Корреляция и ковариация. Коэффициент корреляции Пирсона. Интерпретация значений коэффициента корреляции. Значимость коэффициента корреляции. Коэффициент корреляции Спирмена. Корреляционная матрица. Семинар 8. Проведение корреляционного анализа и построение корреляционных матриц в R. Анализ содержания политологических исследований, использовавших корреляционный анализ.
- МНК-регрессия: принцип, интерпретация, оформление регрессионной выдачиЛекция 9. Отличие регрессии от корреляции. Зависимая и независимая переменные. Метод наименьших квадратов (МНК): суть, допущения. Парная линейная регрессия: уравнение регрессии, интерпретация регрессионной выдачи. Коэффициент детерминации (R 2 ). Лекция 10. Множественная линейная регрессия: уравнение регрессии, параметры, рассчитываемые для независимых переменных, значение F-статистики для регрессионной модели. Сравнение регрессионных моделей. Нюансы интерпретации коэффициента детерминации и стандартизированных коэффициентов для независимых переменных. Лекция 11. Оформление результатов регрессионной выдачи: примеры из политологических исследований. Оформление результатов регрессионной выдачи в R: пакет stargazer. Композиционное построение исследований, использующих регрессионный анализ. Нюансы использования категориальных и порядковых переменных в регрессионном анализе. Семинар 9. Реализация парной линейной регрессии в R. Визуализация сути метода наименьших квадратов. Интерпретация результатов регрессионного анализа. Семинар 10. Реализация множественной линейной регрессии в R. Сравнение регрессионных моделей. Интерпретация результатов регрессионного анализа. Семинар 11. Рассмотрение композиционного построения политологического исследования, использующего в качестве основного метода анализа данных множественную линейную регрессию. Рассмотрение особенной включения в регрессионные модели категориальных и порядковых переменных: работа с базой данных Duncan.
- Технические и содержательные проблемы регрессионных моделей. Регрессионная диагностикаЛекция 12. Предпосылки МНК-регрессии. Технические проблемы регрессионных моделей: мультиколлинеарность, гетероскедастичность, выбросы, влиятельные наблюдения. Диагностика и способы решения технических проблем регрессионных моделей. Лекция 13. Содержательные проблемы регрессионных моделей: эндогенность, исключение из анализа релевантных объяснительных переменных, включение в анализ нерелевантных объяснительных переменных. Проблема смещения выборки. Семинар 12. Подробное рассмотрение сути технических проблем регрессионных моделей: мультиколлинеарности, гетероскедастичности, выбросов и влиятельных наблюдений. Работа с базой данных Duncan и базами данных, собранными студентами. Работа с функциями идентификации мультиколлинеарности: vif(); гетероскедастичности: ncvTest(), spreadLevelPlot(); выбросов: qqplot(), outlierTest(); влиятельных наблюдений: influencePlot() и др. Семинар 13. Рассмотрение проблем смещения выборки (отбора единиц анализа по зависимой переменной), эндогенности, исключения из анализа релевантных объяснительных переменных и включения в анализ нерелевантных объяснительных переменных.
- Обобщенные линейные модели: краткий обзорЛекция 14. Обобщенные линейные модели: суть, виды. Логистическая регрессия: суть, виды. Уравнение бинарной логистической регрессии. Параметры оценки логистических моделей. Выдача логистической регрессии, ее интерпретация. Предсказанные вероятности и отношения шансов. Лекция 15. Порядковая логистическая регрессия: особенности. Выдача порядковой логистической регрессии. Предсказанные вероятности и отношения шансов для порядковой логистической регрессии. Подведение итогов курса. Семинар 14. Реализация логистической регрессии в R. Рассмотрение политологического исследования, использующего в качестве основного метода анализа данных логистическую регрессию. Семинар 15. На семинарском занятии проводится контрольная работа.
Элементы контроля
- Контрольная работаВыполнение заданий в письменной форме. Время контрольной работы 1 час 20 минут
- Домашнее заданиеПодготовка четырех файлов, отражающих работу студента с количественными данными
- ЭкзаменВыполнение заданий в письменной форме. Время экзамена 1 час 20 минут
- Аудиторная работа
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)Накопленная оценка по дисциплине рассчитывается с помощью взвешенной суммы оценок за отдельные формы текущего контроля знаний и аудиторную работу следующим образом: Оценка накопленная = 0.4 * Оценка за контрольную работу + 0.4 * Оценка за домашнее задание + 0.2 * Оценка за работу на семинарах. Результирующая оценка по дисциплине (которая идет в диплом) рассчитывается следующим образом: Оценка результирующая = 0.6 * Оценка накопленная + 0.4 * Оценка за экзамен
Список литературы
Рекомендуемая основная литература
- Field, A. V. (DE-588)128714581, (DE-627)378310763, (DE-576)186310501, aut. (2012). Discovering statistics using R Andy Field, Jeremy Miles, Zoë Field. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.363067604
- Golosov, G. V., & Konstantinova, M. (2016). Gubernatorial Powers in Russia The Transformation of Regional Institutions Under the Centralizing Control of the Federal Authorities. Problems of Post-Communism, 63(4), 241–252. https://doi.org/10.1080/10758216.2016.1146906
- R в действии. Анализ и визуализация данных на языке R, Кабаков, Р.И., 2014
Рекомендуемая дополнительная литература
- Geddes, B. (DE-588)171415787, (DE-576)132211866. (2003). Paradigms and sand castles : theory building and research design in comparative politics / Barbara Geddes. Ann Arbor, Mich.: University of Michigan Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.104638176