• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis in Sociology

2020/2021
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Delivered at:
School of Sociology
Course type:
Compulsory course
When:
3 year, 1, 2 module

Instructors


Kuskova, Valentina


Suleimanova, Anna


Khvatsky, Gregory

Программа дисциплины

Аннотация

Целями освоения дисциплины «Анализ данных в социологии» являются изучение и практическое освоение теории вероятностей, математической статистики и базовых методов статистического анализа данных в социальных науках;Изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных, таких как SPSS и STATA; приобретение понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью статистических методов. В результате освоения дисциплины студент должен знать основные понятия теории вероятностей, математической статистики, методы статистического анализа данных в пределах программы курса; уметь ставить и понимать социологические задачи, которые могут быть решены с помощью статистического анализа данных, понимать специфику данных, используемых в статистическом анализе, а также владеть навыками самостоятельного статистического анализа данных на компьютере в программах SPSS и STATA.
Цель освоения дисциплины

Цель освоения дисциплины

  • Изучение базовых методов статистического анализа данных в социальных науках
  • Изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных:SPSS и Stata
  • Приобретение понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью статистических методов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимает, в каких случаях вместо линейной или бинарной логистической, необходимо использовать мультиномиальную логистическую регрессию.
  • Знает специфику зависимой переменной в модели мультиномиальной логистической регрессии
  • Умеет строить модель мультиномиальной логистической регрессии в SPSS
  • Умеет интерпретировать модель мультиномиальной логистической регрессии в линейной и экспоненциальной форме
  • Умеет оценивать качество модели мультиномиальной логистической регрессии
  • Знает суть основных алгоритмов деревьев классификации: CHAID, CRT, QUEST
  • Умеет строить модели деревьев классификации (CHAID, CRT,QUEST) с помощью пакета SPSS
  • Умеет интерпретировать модели деревьев классификации и оценивать их качество
  • Понимает задачи, решаемые с помощью многомерного шкалирования.
  • Понимает разницу между условиями использования метрического и неметрического МШ
  • Умеет строить в SPSS модели многомерного шкалирования различной спецификации и сравнивать их
  • Умеет оценивать качество моделей многомерного шкалирования
  • Can build and interpret statistical models base on analysis of longitudinal Data
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Мультиномиальная логистическая регрессия
    Представление зависимой переменной в мультиномиальной логистической регрессии. Выбор контрольных групп. Интерпретация коэффициентов уравнения мультиномиальной логистической регрессии. Ограничения мультиномиальной логистической регрессии.
  • Тема 2. Модели многомерного шкалирования
    Многомерное шкалирование как метод анализа данных, его цели и задачи. Классификация методов многомерного шкалирования. Исходные данные для многомерного шкалирования. Понятие близости данных. Методы получения данных о близости. Меры близости. Матрицы сходства и расстояния в многомерном шкалировании. R и Q – модели в многомерном шкалировании. Представление и первичная обработка статистических данных в многомерном шкалировании. Подготовка данных к многомерному шкалированию: типы матриц (матрица условных вероятностей, или матрица идентификаций, матрицы перехода, матрица совместных вероятностей, матриц мер различия профилей). Метрическое многомерное шкалирование. Классическая модель многомерного шкалирования Торгерсона: алгоритм, теоретические постулаты. Обобщенный алгоритм метрического многомерного шкалирования. Понятие о неметрическом многомерном шкалировании, его особенности. Метрики расстояний. Модели НМШ. Алгоритм НМШ. Стресс-формулы.
  • Тема 3. Модели деревьев классификации (деревьев решений).
    Модели деревьев решений. Особенности работы алгоритмов CHAID и CRT. Ошибки классификации, определение понятия риска. Проверка качества модели, способы решения проблемы излишней подгонки дерева: кросс-проверка, V-кратная кросс-проверка.
  • Longitudinal Data
    This part of course is about quantitative methods, namely statistics, applied to social sciences. Specifically, we will focus on certain statistical competencies that help evaluate processes over time. I expect you to understand the basics of statistics you’ve learned previously in this course; everything else we will learn in this class. As you will see, we will use a lot of real-world datasets, and I am concerned more with your understanding on how statistic works as opposed to memorizing the formulas. This class will be unique in a sense that I will bring a lot of non-statistical material to help you understand the world of decision sciences. Many students are afraid of statistics. Please don’t be. I promise you, you don’t have to have the brain of Einstein to master it. You do have to work hard and keep on top of the material, because it is cumulative. If you feel that you start falling behind, see me immediately – we’ll develop a strategy to help you catch up. At the conclusion of the course, students should be able to: 1. Understand the meaning and use of longitudinal models. 2. Present and/or interpret data in tables and charts. 3. Understand and apply descriptive statistical measures to real-life situations. 4. Understand and apply probability distributions to model different types of social processes. 5. Understand and apply statistical inference techniques (including statistical estimation and hypothesis testing) in longitudinal settings. 6. Understand and apply different types of longitudinal models to data; select an appropriate model based on the type of data. 7. Be able to forecast future numbers based on historical data. 8. Use computer software to perform statistical analysis on data (specifically, STATA). 9. Define and resolve problems, and recognize the most common decision errors and make tough decisions in a competent way. 10. Work within a team to analyze real-life problem(s) and make substantive recommendations for improvement.
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа "Мультиномиальная логистическая регрессия"
  • неблокирующий Контрольная работа "Деревья классификации"
  • неблокирующий Контрольная работа "Многомерное шкалирование"
  • неблокирующий Итоговая контрольная работа за 1й модуль
  • неблокирующий Homeworks in 2 module
  • неблокирующий Quizzes in 2rd module
  • неблокирующий In-Class Labs in 2rd module
  • неблокирующий Final work for 2rd module
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.25 * Final work for 2rd module + 0.1 * Homeworks in 2 module + 0.1 * In-Class Labs in 2rd module + 0.05 * Quizzes in 2rd module + 0.2 * Итоговая контрольная работа за 1й модуль + 0.1 * Контрольная работа "Деревья классификации" + 0.1 * Контрольная работа "Многомерное шкалирование" + 0.1 * Контрольная работа "Мультиномиальная логистическая регрессия"
Список литературы

Список литературы

Рекомендуемая основная литература

  • Baltagi, B. H. (2015). The Oxford Handbook of Panel Data. New York, NY: Oxford University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=864682
  • SPSS 19: профессиональный статистический анализ данных, Наследов, А., 2011
  • Анализ социологических данных : методология, дескриптивная статистика, изучение связей между номинальными признаками : учеб.пособие для вузов, Толстова, Ю. Н., 2000
  • Основы многомерного шкалирования : учеб. пособие для вузов, Толстова, Ю. Н., 2006

Рекомендуемая дополнительная литература

  • Устелемова М.С. - Шкалирование - Национальный Открытый Университет "ИНТУИТ" - 2016 - 69с. - ISBN: - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100491