• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научно-исследовательский семинар: Анализ и визуализация данных в психологии

2020/2021
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 3, 4 модуль

Преподаватели

Программа дисциплины

Аннотация

Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 37.03.01 - «Психология» подготовки бакалавра, изучающих дисциплину «Научно-исследовательский семинар Анализ и визуализация данных в психологии». Программа разработана в соответствии с: • Оригинальным образовательным стандартом НИУ ВШЭ по направлению 37.03.01 «Психология»; • Образовательной программой 37.03.01 «Психология»; • Рабочим учебным планом университета по направлению 030300.62 «Психология» подготовки бакалавра, утверждённым в 2019 г Целями освоения дисциплины «Научно-исследовательский семинар Анализ и визуализация данных в психологии» являются: • освоение основных методов многомерного статистического анализа данных психологических исследований (регрессионный анализ, эксплораторный и конфирматорный факторный анализ, кластерный анализ); • освоение практических навыков многомерной статистической обработки эмпирических данных с использованием компьютерных программ (программная среда R); • освоение практических навыков визуализации данных (программная среда R). Формы текущего контроля - домашние задания: "Визуализация данных", "Критическая оценка результатов регрессионного анализа", "Прохождение интерактивного обучающего курса", "Регрессионный анализ данных", "Факторный и кластерный анализ данных". Промежуточный контроль - взвешенная сумма оценок по текущему контролю.
Цель освоения дисциплины

Цель освоения дисциплины

  • освоение основных методов многомерного статистического анализа данных психологических исследований
  • освоение практических навыков многомерной статистической обработки эмпирических данных с использованием компьютерных программ
  • освоение практических навыков визуализации данных с использованием компьютерных программ
Планируемые результаты обучения

Планируемые результаты обучения

  • Осуществляет поиск дополнительной информации, необходимой для уточнения параметров статистической обработки данных
  • Под научным руководством осуществляет обработку и визуализацию данных количественными методами с использованием современного программного обеспечения
  • Под научным руководством дает содержательную интерпретацию полученным результатам количественного анализа данных, способен осмыслить полученные результаты в общем академическом контексте исследуемой проблематики
  • Осуществляет визуализацию данных с использованием современного программного обеспечения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Общее представление о многомерных методах статистического анализа данных
    Теоретические, эмпирические и статистические гипотезы. Квазиэкспериментальные исследования и статистические методы анализа данных. Многомерные статистические методы анализа данных: область применения, цели, результаты. Статистическая достоверность выводов на выборке относительно генеральной совокупности. Процедура статистического вывода: понятие статистического критерия, виды гипотез, понятия уровня значимости, ошибок I и II рода. Проблема статистической мощности анализа, её связь с методом проверки гипотез, размером эффекта, объёмом выборки, критерием принятия решений.
  • R - программный язык для анализа и визуализации данных
    Базовые принципы синтаксиса R. Загрузка и трансформация данных в R. Базовые операции программирования в R.
  • Визуализация данных
    Основные виды графического преставления распределений: гистограммы, кривые плотности вероятности, box-plots и т.д. Диаграммы рассеяния и линии тренда как визуализация отношений между исследуемыми переменными. Пакет R ggplot2: визуализация данных
  • Регрессионный анализ данных
    Цели и задачи регрессионного анализа данных. Базовые математические основания регрессионного анализа. Множественная линейная регрессия. Оценка качества линейных регрессионных моделей. Интерпретация результатов линейного регрессионного анализа данных. Биномиальная регрессия. Оценка качества биномиальных регрессионных моделей. Интерпретация результатов биномиального регрессионного анализа данных. Реализация регрессионного анализа данных в программной среде R. Нормативы представления результатов регрессионного анализа данных в научном отчете.
  • Введение в машинное обучение
    Основные принципы и типы машинного обучения. Реализация базовых моделей машинного обучения в программной среде R.
  • Эксплораторный факторный анализ данных
    Цели и задачи эксплораторного факторного анализа данных. Базовые математические основания эксплораторного факторного анализа. Оценка качества результатов эксплораторного факторного анализа. Интерпретация результатов эксплораторного факторного анализа данных. Реализация эксплораторного факторного анализа данных в программной среде R. Нормативы представления результатов эксплораторного факторного анализа данных в научном отчете.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание "Визуализация данных"
    Задание выполняется в группах (не более 5 человек). Студенты получают набор данных и 5 вопросов к этим данным, на которые надо ответить, построив соответствующие графики. Домашнее задание загружается в систему LMS одним из членов группы в одной из следующих форм: R notebook, содержащий текст отчета и код, строящий графики (предпочтительнее) Архив, содержащий два отдельных файла: отчет в формате pdf + скрипт в R
  • неблокирующий Домашнее задание "Критическая оценка результатов регрессионного анализа"
    Задание представляет собой анализ научной статьи. Задание выполняется индивидуально, при этом выбранные статьи не должны повторяться среди студентов одного курса. В качестве статьи может быть выбрана работа на любую тему, однако в ней должен быть представлен регрессионный анализ эмпирических данных. Подходящими являются статьи на русском либо английском языке, опубликованные в научных журналах, входящих хотя бы в один из списков: WoS, Scopus, ВАК, опубликованные не ранее 2000 г. Необходимо: 1) Выбрать любую научную статью по психологии, в которой представлены результаты линейного регрессионного анализа. 2) Описать результаты применения регрессионного анализа в статье. 3) Оценить возможности применения регрессионного анализа к данным, представленным в статье (размер выборки, мультиколлинеарность, связь между предикторами и зависимой переменной). 4) Представить цели и гипотезы исследования (из статьи) и оценить соответствие применения регрессионного анализа целям и гипотезам, заявленным в статье (насколько содержательно в данном дизайне необходим регрессионный анализ). 5) Оценить, насколько корректно представлены результаты регрессионного анализа в исследовании (все ли необходимые параметры фита и коэффициенты представлены; если нет - то какие вопросы к анализу это вызывает). 6) Оценить корректность авторских выводов из результатов регрессионного анализа данных (насколько сделанные авторами выводы соответствуют полученным статистическим результатам). Задание сдается в виде pdf-файла.
  • неблокирующий Домашнее задание "Регрессионный анализ данных"
    Задание представляет собой самостоятельный регрессионный анализ данных и описание полученных результатов. Задание выполняется в группе (не более 5 человек). На любом наборе данных необходимо построить и описать две модели: Для линейной регрессии: 1) Выбрать зависимую переменную и предикторы и описать предполагаемую линейную модель. 2) Провести анализ статистической мощности выборки для проверки предполагаемой линейной модели. Описать результаты оценки статистической мощности. 3) Оценить и описать наличие угрозы мультиколлинеарности (связи между предикторами). Если угроза есть, предложить и реализовать способы устранения этой угрозы до основного анализа. 4) Провести линейный регрессионный анализ по предложенной модели. Описать результаты линейной регрессии (параметры fit и содержательная интерпретация). 5) Провести и описать диагностический анализ модели пост-фактум (графики распределения остатков, влиятельные наблюдения и т.д.). 6) Сделать заключение - общий вывод о качестве проверяемой модели и возможных коррекциях. Для биномиальной (или мультиномиальной) регрессии: 7) Выбрать зависимую переменную и предикторы и описать предполагаемую биномиальную (мультиномиальную) модель. 8) Провести биномиальный (мультиномиальный) регрессионный анализ по предложенной модели. Описать результаты биномиальной (мультиномиальной) регрессии (обоснование критерия, анализ confusion matrix и содержательная интерпретация предикторов). 9) Сделать заключение - общий вывод о качестве проверяемой модели и возможных коррекциях. Домашнее задание загружается в систему LMS одним из членов группы в одной из следующих форм: Архив, содержащий 2 файла: R notebook + файл с данными (предпочтительнее) Архив, содержащий 3 файла: отчет в формате pdf + скрипт в R + файл данных
  • неблокирующий Домашнее задание "Факторный анализ данных"
    Задание выполняется в группе (не более 5 человек). Этапы выполнения задания (критерии оценивания): 1) Проанализировать корреляционную структуру имеющегося набора данных (1 балл); 2) Оценить возможности применения эксплораторного факторного анализа для обработки имеющегося набора данных (1 балл); 3) Описать результаты применения эксплораторного факторного анализа (2 балла); 4) Содержательно проинтерпретировать результаты эксплораторного факторного анализа (2 балла); 5) Визуализировать результаты эксплораторного факторного анализа (2 балла). Домашнее задание загружается в систему LMS одним из членов группы в одной из следующих форм: Архив, содержащий 2 файла: R notebook + файл с данными (предпочтительнее) Архив, содержащий 3 файла: отчет в формате pdf + скрипт в R + файл данных * примеры открытых источников данных: https://www.springboard.com/blog/free-public-data-sets-data-science-project/ https://openpsychometrics.org/_rawdata/
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.25 * Домашнее задание "Визуализация данных" + 0.25 * Домашнее задание "Критическая оценка результатов регрессионного анализа" + 0.25 * Домашнее задание "Регрессионный анализ данных" + 0.25 * Домашнее задание "Факторный анализ данных"
Список литературы

Список литературы

Рекомендуемая основная литература

  • Анализ данных : учебник для академического бакалавриата / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2016. — 490 с. — (Бакалавр. Академический курс). — ISBN 978-5-9916-5591-0. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/385663
  • Мастицкий С.Э. - Визуализация данных с помощью ggplot2 - Издательство "ДМК Пресс" - 2017 - 222с. - ISBN: 978-5-97060-470-0 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/107895
  • Мастицкий С.Э., Шитиков В.К. - Статистический анализ и визуализация данных с помощью R - Издательство "ДМК Пресс" - 2015 - 496с. - ISBN: 978-5-97060-301-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/73072

Рекомендуемая дополнительная литература

  • Корнилова Т.В. - ЭКСПЕРИМЕНТАЛЬНАЯ ПСИХОЛОГИЯ 3-е изд., пер. и доп. Учебник для бакалавров - М.:Издательство Юрайт - 2016 - 639с. - ISBN: 978-5-9916-3201-0 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/eksperimentalnaya-psihologiya-387603
  • Син Такахаси - Занимательная статистика. Факторный анализ. Манга - Издательство "ДМК Пресс" - 2015 - 248с. - ISBN: 978-5-97060-116-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93563
  • Флах П. - Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных - Издательство "ДМК Пресс" - 2015 - 400с. - ISBN: 978-5-97060-273-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/69955