• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2021/2022

Анализ данных в образовании

Статус: Курс обязательный (Доказательное развитие образования)
Направление: 38.04.04. Государственное и муниципальное управление
Когда читается: 1-й курс, 1-3 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Прогр. обучения: Доказательное развитие образования
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

Центральная задача курса — научить слушателей понимать суть базовых методов количественного анализа данных (от описательной статистики до регрессии). Главной особенностью курса является то, что его материал излагается на примерах, связанных с областью образования: слушатели знакомятся с результатами современных исследований в этой области и тренируются на данных исследований и мониторингов качества образования. Прохождение курса подразумевает самостоятельную внеаудиторную работу и освоение предложенных онлайн курсов. Большинство аудиторной работы будет посвящено дискуссиям и групповой работе.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать возможности и ограничения изучаемых методов анализа
  • Научиться подбирать методы количественного анализа данных под исследовательские вопросы, проводить анализ и интерпретировать его результаты
  • Использовать R для статистического анализа данных
  • Научиться содержательно и статистически описывать результаты анализа
Планируемые результаты обучения

Планируемые результаты обучения

  • Различает типы шкал переменных
  • Описывает данные и переменные (уровни измерения, соответствующие типу шкалы описательные статистики)
  • Интерпретирует результаты анализа, полученные с помощью различных методов, и оценивает их соответствие исследовательскому вопросу
  • Реализовывает анализ с использованием изучаемых методов в R
  • Представляет результаты своего анализа и других исследований, опубликованных в ведущих мировых журналах, в формах отчетов и презентаций
  • Подбирает и объясняет выбор методов под поставленные исследовательские вопросы с учетом возможностей и ограничений методов анализа
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Базовые понятия статистики применительно к исследованиям в образовании
    Введение в статистику в социальных науках. Данные: переменные и наблюдения. Генеральная совокупность и выборка. Шкалы измерения. Описательная статистика: среднее, медиана, мода, меры разброса. Стандартная ошибка измерения. Доверительный интервал. Нормальное распределение. Стандартизация шкал. Графическое представление базовых статистик.
  • Основы работы с R
    Начало работы в R, знакомство с интерфейсом. Ввод и импорт данных разных форматов (dat, sav, csv и другие). Работа с пакетами. Работа с переменными – кодирование, вычисление новых переменных, свойства переменных. Работа с данными – сортировка, отбор случаев, извлечение случайной выборки, агрегирование, чистка данных. Работа с файлами – слияние нескольких файлов.
  • Основы визуализации данных
    Пакеты tidyverse, shiny, plotly, markdown. Построение графиков, знакомство с грамматикой графиков. Линейная оценка трендов и loess/lowess. Построение и логика дашбордов. Выбор графика в зависимости от цели визуализации и типа данных.
  • Сравнение средних, проверка гипотез и анализ дисперсии
    Статистические гипотезы. Нулевая и альтернативные гипотезы. Ошибки первого и второго рода. Уровень значимости для различных распределений. Степени свободы и таблицы критических значений. Сравнение средних (t-тест и его непараметрические аналоги) и анализ дисперсии (ANOVA, MANOVA и их непараметрические аналоги).
  • Связь между переменными
    Методы определения связи между переменными, измеренными на разных шкалах. Линейная и нелинейная связь. Корреляция (Пирсона, Спирмена) и непараметрические методы. Хи-квадрат. Коэффициент детерминации (R2).
  • Регрессионный анализ
    Линейный регрессионный анализ. Цели и методология. Статистические модели. Парная регрессия. Уравнение и характеристики модели. Интерсепт, регрессионные коэффициенты, ошибки. Множественный регрессионный анализ. Работа с дамми-переменными. Проверка допущений линейного регрессионного анализа. Процент объясненной дисперсии. Проверка качества моделей.
  • Логистическая регрессия
    Нелинейные регрессионные модели. Биноминальное распределение, распределение Бернулли. Бинарная, порядковая и мультиноминальная логистическая регрессия.
  • Факторный анализ
    Эксплораторный факторный анализ и метод главных компонент. Вращение: ортогональное и косоугольное. Факторные нагрузки.
  • Кластерный анализ
    Основные цели, решаемые кластерным анализом, сфера применения. Иерархический кла- стерный анализ. Способы вычисления расстояний между объектами. Способы кластеризации. Неиерархический кластерный анализ, метод k-средних.
Элементы контроля

Элементы контроля

  • неблокирующий Домашние работы
  • неблокирующий Экзамен (проект)
  • неблокирующий Контрольная работа-1
    Контрольная работа в конце второго модуля
  • неблокирующий Контрольная работа-2
    Контрольная работа в третьем модуле
  • неблокирующий Проект
  • неблокирующий Мини-тесты
    Мини-тесты по пройденным темам
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    0.3 * Домашние работы + 0.1 * Контрольная работа-1 + 0.1 * Контрольная работа-2 + 0.1 * Мини-тесты + 0.1 * Проект + 0.3 * Экзамен (проект)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G., 1995
  • Statistical methods for the social sciences, Agresti, A., 2009
  • Using multivariate statistics, Tabachnick, B. G., 2007
  • Математические методы психологического исследования : анализ и интерпретация данных: учеб. пособие, Наследов, А. Д., 2006
  • Статистический анализ и визуализация данных с помощью R, Мастицкий, С. Э., 2015

Рекомендуемая дополнительная литература

  • Discovering statistics using R, Field, A., 2012