• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
14
Март

Анализ данных в социологии

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты
Статус:
Курс обязательный
Когда читается:
2-й курс, 3, 4 модуль

Преподаватели

Программа дисциплины

Аннотация

Целями освоения дисциплины «Анализ данных в социологии» являются изучение и практическое освоение теории вероятностей, математической статистики и базовых методов статистического анализа данных в социальных науках; изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных (пакета SPSS); приобретение понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью статистических методов. В результате освоения дисциплины студент должен знать основные понятия теории вероятностей, математической статистики, методы статистического анализа данных в пределах программы курса; уметь ставить и понимать социологические задачи, которые могут быть решены с помощью статистического анализа данных, понимать специфику данных, используемых в статистическом анализе, а также владеть навыками самостоятельного статистического анализа данных на компьютере в программах SPSS.
Цель освоения дисциплины

Цель освоения дисциплины

  • Изучение и практическое освоение базовых методов статистического анализа данных в социальных науках
  • Изучение и практическое освоение компьютерной программы, применяемой для статистического анализа данных: SPSS
  • Формирование понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью различных статистических методов
Результаты освоения дисциплины

Результаты освоения дисциплины

  • Понимает разницу между условиями применения методов параметрической и непараметрической статистики.
  • Умеет реализовывать с помощью SPSS тесты Манна –Уитни, знаков рангов Вилкоксона и непараметрический анализ Краскла-Уоллиса
  • Умеет содержательно интерпретировать результаты тестов Манна –Уитни, знаков рангов Вилкоксона и непараметрического анализа Краскла-Уоллиса
  • Знает требования к данным для построения моделей линейной регрессии
  • Умеет проводить диагностику моделей линейной регрессии на основные ограничения и устранять несоблюдение этих ограничений
  • Может интерпретировать регрессионные коэффициенты и оценивать качество моделей линейной регрессией
  • Знает какие переменные перед включением в модель линейной регрессии необходимо преобразовать в фиктивные.
  • Знает логику создания фиктивных переменных и умеет их создавать в SPSS
  • Умеет интерпретировать регрессионные коэффициенты в модели линейной регрессии с фиктивными переменными
  • Знает для решения каких задач в модель линейной регрессии включаются эффекты взаимодействия
  • Умеет создавать в SPSS и включать в регрессионную модель эффекты взаимодействия категориальных переменных, категориальных и интервальных переменных.
  • Умеет интерпретировать регрессионные коэффициенты при переменных-эффектах взаимодействия
  • Понимает, в каких случаях вместо линейной регрессии необходимо использовать логистическую регерссию, в частности бинарную.
  • Знает специфику зависимой переменной в модели бинарной логистической регрессии
  • Умеет строить модель бинарной логистической регрессии в SPSS
  • Умеет интерпретировать модель бинарной логистической регрессии в линейной и экспоненциальной форме
  • Умеет оценивать качество модели бинарной логистической регрессии
  • Определяет содержательные задачи, которые могут быть решены с помощью пробит регрессии
  • Формулирует содержательные задачи, для решения которых применим факторный анализ
  • Знает возможности и ограничения применения факторного анализа методом главных компонент (МГК)
  • Знает требования к уровню измерения наблюдаемых переменных для факторного анализа МГК
  • Знает требования к выборке для получения корректных результатов ФА МГК
  • Владеет навыками реализации ФА МГК в SPSS
  • Умеет правильно выбирать метод вращения факторных нагрузок в ФА МГК
  • Умеет интерпретировать полученные значения факторных переменных
  • Умеет интерпретировать факторные нагрузки
  • Отличает вырожденное факторное решение от невырожденного
  • Обосновывает и отбирает итоговое количество факторов в модели
  • Формулирует содержательные задачи, для решения которых применим кластерный анализ
  • Знает возможности и ограничения применения кластерного анализа
  • Знает требования к уровню измерения наблюдаемых переменных для кластерного
  • Знает различия в иерархическом алгоритма КА и КА методом К-средних
  • Владеет навыками реализации иерархического КА и КА методом К-средних в SPSS
  • Умеет правильно интерпретировать таблицу шагов аггломерации (в иерархическом кластерном анализу)
  • Умеет интерпретировать полученные значения кластерных переменных
  • Умеет интерпретировать дендрограмму
  • Определяет качество полученных кластеров (в методе К-Средних): контрастность, наполненность и компактность
  • Обосновывает и отбирает итоговое количество кластеров в модели
  • Умеет проверять кластерную модель на устойчивость
  • Знает отличия пробит регрессии от других пройденных моделей регрессии
  • Знает возможности и ограничения пробит-регрессии
  • Умеет содержательно интерпретировать коэффициенты уравнения пробит-регрессии
  • Интерпретирует занчения медианного отклика и доли естественного отклика в пробит-регрессии
  • Умеет интерпретировать результаты параллельного теста и значений оценки подгонки модели Пирсона
  • Формулирует содержательные задачи, для решения которых применим дискриминантный анализ
  • Знает возможности и ограничения применения дискриминантного анализа
  • Знает требования к уровню измерения переменной образующей кластер и параметров классификации для дискриминантного анализа
  • Владеет навыками реализации дискриминантного анализа в SPSS
  • Понимает смысл дискриминирующей функции, и интерпретирует значения ее коэффициентов.
  • Знает смысл коэффициента канонической корреляции. Интерпретирует коэффициент Лямбда Уилкса и значения центроидов.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Базовые методы непараметрической статистики
    Различия параметрической и непараметрической статистики. Достоинства и недостатки непараметрических методов, по сравнению с параметрическими. Непараметрические аналоги некоторых параметрических методов: одновыборочный тест знаков (непараметрический аналог одновыборочного Т-теста), тесты суммы рангов Манна –Уитни и Вилкоксона (непараметрические аналоги Т-теста для независимых выборок), тест приписанных знаков рангов Вилкоксона (непараметрический аналог Т-теста для связанных выборок) и непараметрический дисперсионный анализ Краскла-Уоллиса (непараметрический аналог однофакторного дисперсионного анализа)
  • Тема 2. Классическая линейная регрессия: парная и множественная. Введение в МНК. Ограничения модели регрессии.
    Парная линейная регрессия. Связь между корреляцией и регрессией. Оценка регрессионных коэффициентов методом наименьших квадратов. Интерпретация регрессионных коэффициентов и стандартных ошибок. Статистическая значимость коэффициентов. Регрессия с несколькими предикторами. Понятие статистического контроля. Интерпретация коэффициентов в множественной регрессии. Коэффициент детерминации R2. Допущения регрессионных моделей и диагностика моделей. Гетероскедастичность. Нелинейные связи. Статистические выбросы. Мультиколлинеарность. Принципы построения регрессионных моделей.
  • Тема 3. Регрессия с фиктивными переменными
    Регрессия с категориальными независимыми переменными. Понятие фиктивных переменных. Интерпретация коэффициентов в регрессии с фиктивными переменными.
  • Тема 4. Эффекты взаимодействия в регрессионных моделях.
    Понятие взаимодействия переменных в регрессионной модели. Эффекты взаимодействия: между двумя интервальными переменными, интервальной и категориальной переменными, двумя категориальными переменными. Интерпретация регрессионных коэффициентов при переменных взаимодействия.
  • Тема 5. Бинарная логистическая регрессия
    Регрессионные модели для бинарных зависимых переменных. Модель линейной вероятности. Логистическая регрессия. Интерпретация коэффициентов логистической регрессии. Шансы и отношения шансов.
  • Тема 6. Пробит-регрессия
    Содержательные задачи, решаемые с помощью пробит-регрессии. Представление зависимой переменной в пробит-регрессии. Специфика интерпретации коэффициентов регрессионного уравнения
  • Тема 7 Факторный анализ
    Модель факторного анализа (ФА) как модель латентных переменных. Различные подходы к определению числа факторов. Процент объясненной дисперсии как показатель качества факторной модели. Индивидуальные значения факторов. Сохранение факторов как новых переменных. Вращение матрицы факторных нагрузок. Ортогональные и неортогональные методы вращения.
  • Тема 8 Кластерный анализ
    Иерархический агломеративный кластерный анализ. Кластерный анализ методом k-средних. Проблемы выбора меры расстояния и формы кластера. Проблема устойчивости кластеризации. Методы оценки устойчивости. Проблема отбора итогового количества кластеров в модели. Описание и интерпретация результатов кластеризации.
  • Тема 9. Дискриминантный анализ
    Содержательные задачи, решаемые с помощью дискриминантного анализа. Специфика алгоритма, требования к уровню измерения переменных Дискриминирующая функция, интерпретация коэффициентов. Каноническая корреляция. Коэффициент Лямбда Уилкса. Центроиды. Проверка качества модели: кросс-проверка, V-кратная кросс-проверка.
  • Категориальный метод главных компонент (CatPCA)
    Категориальный метод главных компонент (CatPCA) - аналог традиционного метода главных компонент, в который встроена возможность его применения к категориальным переменным. Он предназначен для отображения (в т.ч., графического) связей между категориями многих переменных и объединения этих переменных в одну/несколько интегральных (латентных) переменных. Переменные могут принадлежать к любому типу шкалы (предпочтителен ранговый). Требуемый уровень подготовки пользователя: средний. Желательно владение методами: коэффициенты корреляции Пирсона и ранговые, а также метод главных компонент (МГК).
Элементы контроля

Элементы контроля

  • неблокирующий Тест "Непараметрическая статистика"
  • неблокирующий Тест "Линейная регрессия"
  • неблокирующий Тест "Регрессия с фиктивными переменными"
  • неблокирующий Тест "Бинарная логистическая регрессия"
  • неблокирующий Домашнее задание «Непараметрическая статистика"
    Возможна выборочная устная защита домашнего задания.
  • неблокирующий Домашнее задание «Классическая линейная регрессия"
    Возможна выборочная устная защита домашнего задания.
  • неблокирующий Домашнее задание «Регрессия с фиктивными переменными и эффекты взаимодействия»
    Возможна выборочная устная защита домашнего задания.
  • неблокирующий Домашнее задание «Бинарная логистическая регрессия»
    Возможна выборочная устная защита домашнего задания.
  • неблокирующий Экзамен (итоговый тест)
  • неблокирующий Отчет по анализу данных в курсовой работе
  • неблокирующий Контрольная работа за 3й модуль
  • неблокирующий Контрольная работа за 4й модуль
  • неблокирующий Тест "Эффекты взаимодействия в регрессионных моделях"
  • неблокирующий Тест "Пробит регрессия"
  • неблокирующий Тест "Факторный анализ"
  • неблокирующий Тест "Кластерный анализ"
  • неблокирующий Тест "Категориальный метод главных компонент"
  • неблокирующий Тест "Дискриминантный анализ"
  • неблокирующий Домашнее задание «Факторный и кластерный анализы»
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.03 * Домашнее задание «Бинарная логистическая регрессия» + 0.03 * Домашнее задание «Классическая линейная регрессия" + 0.03 * Домашнее задание «Непараметрическая статистика" + 0.03 * Домашнее задание «Регрессия с фиктивными переменными и эффекты взаимодействия» + 0.03 * Домашнее задание «Факторный и кластерный анализы» + 0.1 * Контрольная работа за 3й модуль + 0.1 * Контрольная работа за 4й модуль + 0.05 * Отчет по анализу данных в курсовой работе + 0.02 * Тест "Бинарная логистическая регрессия" + 0.02 * Тест "Дискриминантный анализ" + 0.02 * Тест "Категориальный метод главных компонент" + 0.02 * Тест "Кластерный анализ" + 0.02 * Тест "Линейная регрессия" + 0.02 * Тест "Непараметрическая статистика" + 0.02 * Тест "Пробит регрессия" + 0.02 * Тест "Регрессия с фиктивными переменными" + 0.02 * Тест "Факторный анализ" + 0.02 * Тест "Эффекты взаимодействия в регрессионных моделях" + 0.4 * Экзамен (итоговый тест)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Chatterjee, S., Hadi, A. S., & Ebooks Corporation. (2012). Regression Analysis by Example (Vol. Fifth edition). Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=959808
  • Elementary statistics : a step by step approach, Bluman A. G., 1995
  • Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
  • SPSS 19: профессиональный статистический анализ данных, Наследов А., 2011
  • SPSS: искусство обработки информации : анализ стат. данных и восстановление скрытых закономерностей: пер. с нем., Бююль А., Цефель П., 2002
  • SPSS: Статистический анализ в маркетинговых исследованиях, Таганов Д., 2005
  • Анализ социологических данных с помощью пакета SPSS : учеб. пособие для вузов, Крыштановский А. О., 2006
  • Маркетинговые исследования с SPSS: Учебное пособие / Г. Моосмюллер, Н.Н. Ребик. - 2-e изд. - М.: ИНФРА-М, 2011. - 200 с.: 60x90 1/16. - (Высшее образование). (обложка) ISBN 978-5-16-004240-4 - Режим доступа: http://znanium.com/catalog/product/257371

Рекомендуемая дополнительная литература

  • - Син Такахаси — Занимательная статистика. Факторный анализ. Манга - Издательство "ДМК Пресс" - 2015 - ISBN: 978-5-97060-116-7 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/93563