• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научно-исследовательский семинар: Анализ и визуализация данных в психологии

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс обязательный
Когда читается:
2-й курс, 1, 2 модуль

Преподаватели


Ловаков Андрей Владимирович

Программа дисциплины

Аннотация

Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 37.03.01 - «Психология» подготовки бакалавра, изучающих дисциплину «Научно-исследовательский семинар Анализ и визуализация данных в психологии». Программа разработана в соответствии с: • Оригинальным образовательным стандартом НИУ ВШЭ по направлению 37.03.01 «Психология»; • Образовательной программой 37.03.01 «Психология»; • Рабочим учебным планом университета по направлению 030300.62 «Психология» подготовки бакалавра, утверждённым в 2019 г Целями освоения дисциплины «Научно-исследовательский семинар Анализ и визуализация данных в психологии» являются: • освоение основных методов многомерного статистического анализа данных психологических исследований (регрессионный анализ, эксплораторный и конфирматорный факторный анализ, кластерный анализ); • освоение практических навыков многомерной статистической обработки эмпирических данных с использованием компьютерных программ (программная среда R); • освоение практических навыков визуализации данных (программная среда R). Формы текущего контроля - домашние задания: "Визуализация данных", "Критическая оценка результатов регрессионного анализа", "Прохождение интерактивного обучающего курса", "Регрессионный анализ данных", "Факторный и кластерный анализ данных". Промежуточный контроль - взвешенная сумма оценок по текущему контролю.
Цель освоения дисциплины

Цель освоения дисциплины

  • освоение основных методов многомерного статистического анализа данных психологических исследований
  • освоение практических навыков многомерной статистической обработки эмпирических данных с использованием компьютерных программ
  • освоение практических навыков визуализации данных с использованием компьютерных программ
Планируемые результаты обучения

Планируемые результаты обучения

  • Осуществляет поиск дополнительной информации, необходимой для уточнения параметров статистической обработки данных
  • Под научным руководством осуществляет обработку и визуализацию данных количественными методами с использованием современного программного обеспечения
  • Осуществляет визуализацию данных с использованием современного программного обеспечения
  • Под научным руководством дает содержательную интерпретацию полученным результатам количественного анализа данных, способен осмыслить полученные результаты в общем академическом контексте исследуемой проблематики
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Общее представление о многомерных методах статистического анализа данных
    Теоретические, эмпирические и статистические гипотезы. Квазиэкспериментальные исследования и статистические методы анализа данных. Многомерные статистические методы анализа данных: область применения, цели, результаты. Статистическая достоверность выводов на выборке относительно генеральной совокупности. Процедура статистического вывода: понятие статистического критерия, виды гипотез, понятия уровня значимости, ошибок I и II рода. Проблема статистической мощности анализа, её связь с методом проверки гипотез, размером эффекта, объёмом выборки, критерием принятия решений.
  • R - программный язык для анализа и визуализации данных
    Базовые принципы синтаксиса R. Загрузка и трансформация данных в R. Базовые операции программирования в R.
  • Визуализация данных
    Основные виды графического преставления распределений: гистограммы, кривые плотности вероятности, box-plots и т.д. Диаграммы рассеяния и линии тренда как визуализация отношений между исследуемыми переменными. Пакет R ggplot2: визуализация данных
  • Регрессионный анализ данных
    Цели и задачи регрессионного анализа данных. Базовые математические основания регрессионного анализа. Множественная линейная регрессия. Оценка качества линейных регрессионных моделей. Интерпретация результатов линейного регрессионного анализа данных. Биномиальная регрессия. Оценка качества биномиальных регрессионных моделей. Интерпретация результатов биномиального регрессионного анализа данных. Реализация регрессионного анализа данных в программной среде R. Нормативы представления результатов регрессионного анализа данных в научном отчете.
  • Введение в машинное обучение
    Основные принципы и типы машинного обучения. Реализация базовых моделей машинного обучения в программной среде R.
  • Эксплораторный факторный анализ данных
    Цели и задачи эксплораторного факторного анализа данных. Базовые математические основания эксплораторного факторного анализа. Оценка качества результатов эксплораторного факторного анализа. Интерпретация результатов эксплораторного факторного анализа данных. Реализация эксплораторного факторного анализа данных в программной среде R. Нормативы представления результатов эксплораторного факторного анализа данных в научном отчете.
  • Конфирматорный факторный анализ данных
    Цели и задачи конфирматорного факторного анализа данных. Базовые математические основания конфирматорного факторного анализа. Оценка качества результатов конфирматорного факторного анализа. Интерпретация результатов конфирматорного факторного анализа данных. Реализация конфирматорного факторного анализа данных в программной среде R. Нормативы представления результатов конфирматорного факторного анализа данных в научном отчете.
  • Кластерный анализ данных
    Цели и задачи кластерного анализа данных. Базовые математические основания кластерного анализа. Оценка качества результатов кластерного анализа. Интерпретация результатов кластерного анализа данных
  • Анализ латентных профилей
    Цели и задачи анализа латентных профилей. Базовые математические основания анализа латентных профилей. Оценка качества результатов анализа латентных профилей. Интерпретация результатов анализа латентных профилей. Реализация анализа латентных профилей в программной среде R.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание "Прохождение интерактивного обучающего курса"
    Задание выполняется индивидуально. В качестве контроля самостоятельной работы по освоению программного языка R необходимо выполнить интерактивный курс R Programming пакета swirl. Данный курс содержит 15 тематических блоков. Отчетность осуществляется в форме сдачи текстовой копии консоли с подтверждением авторства (в электронном виде).
  • неблокирующий Домашнее задание "Визуализация данных"
    Задание выполняется индивидуально. Студенты получают набор данных и образцы 10 графиков, которые нужно построить.
  • неблокирующий Домашнее задание "Критическая оценка результатов регрессионного анализа"
    Задание представляет собой анализ научной статьи. Задание выполняется индивидуально, при этом выбранные статьи не должны повторяться среди студентов одного курса. В качестве статьи может быть выбрана работа на любую тему, однако в ней должен быть представлен регрессионный анализ эмпирических данных. Подходящими являются статьи на русском либо английском языке, опубликованные в научных журналах, входящих хотя бы в один из списков: WoS, Scopus, ВАК, опубликованные не ранее 2000 г. Необходимо 1) Выбрать любую научную статью по психологии, в которой представлены результаты линейного регрессионного анализа. 2) Описать результаты применения регрессионного анализа в статье. 3) Оценить возможности применения регрессионного анализа к данным, представленным в статье (размер выборки, мультиколлинеарность, связь между предикторами и зависимой переменной). 4) Оценить соответствия применения регрессионного анализа целям и гипотезам, заявленным в статье (насколько содержательно в данном дизайне необходим регрессионный анализ). 5) Оценить, насколько корректно представлены результаты регрессионного анализа в исследовании (все ли необходимые параметры фита и коэффициенты представлены; если нет - то какие вопросы к анализу это вызывает). 6) Оценить корректность авторских выводов из результатов регрессионного анализа данных (насколько сделанные авторами выводы соответствуют полученным статистическим результатам). Задание сдается в виде pdf-файла.
  • неблокирующий Домашнее задание "Регрессионный анализ данных"
    Задание представляет собой самостоятельный регрессионный анализ данных и описание полученных результатов. Задание выполняется индивидуально. На любом наборе данных (собственном или публичном*) необходимо 1) Выбрать зависимую переменную и предикторы и описать предполагаемую линейную модель. 2) Провести анализ статистической мощности выборки для проверки предполагаемой линейной модели. Результаты оценки статистической мощности описать. 3) Оценить и описать наличие угрозы мультиколлинеарности (связи между предикторами). Если угроза есть, предложить и реализовать способы устранения этой угрозы до основного анализа. 4) Провести линейный регрессионный анализ по предложенной модели. Описать результаты линейной регрессии (параметры fit и содержательная интерпретация). 5) Провести и описать диагностический анализ модели пост-фактум (графики распределения остатков, влиятельные наблюдения и т.д.). 6. Сделать заключение - общий вывод о качестве проверяемой модели и возможных коррекциях. Домашнее задание сдается в виде 3 файлов: отчет в формате pdf + скрипт в R + файл данных * примеры открытых источников данных: https://www.springboard.com/blog/free-public-data-sets-data-science-project/ https://openpsychometrics.org/_rawdata/
  • неблокирующий Домашнее задание "Факторный и кластерный анализ данных"
    Задание представляет собой факторный и кластерный анализ данных и описание полученных результатов. Задание выполняется в групповой форме (группы до 5 человек включительно). На любом наборе данных (собственном или публичном*) необходимо 1) Выполнить эксплораторный факторный анализ данных: а) оценить возможности применения эксплораторного факторного анализа для обработки имеющегося набора данных; б) описать результаты применения эксплораторного факторного анализа; в) содержательно проинтерпретировать результаты эксплораторного факторного анализа; г) визуализировать результаты эксплораторного факторного анализа 2) Проверить результаты эксплораторного факторного анализа средствами конфирматорного факторного анализа: а) описать результаты применения конфирматорного факторного анализа; б) содержательно проинтерпретировать результаты конфирматорного факторного анализа; в) визуализировать результаты конфирматорного факторного анализа 3) Выполнеть кластерный анализ данных: а) описать результаты применения кластерного анализа; б) содержательно проинтерпретировать результаты кластерного анализа; в) визуализировать результаты кластерного анализа Домашнее задание сдается в виде 3 файлов: отчет в формате pdf + скрипт в R + файл данных * примеры открытых источников данных: https://www.springboard.com/blog/free-public-data-sets-data-science-project/ https://openpsychometrics.org/_rawdata/
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.15 * Домашнее задание "Визуализация данных" + 0.15 * Домашнее задание "Критическая оценка результатов регрессионного анализа" + 0.1 * Домашнее задание "Прохождение интерактивного обучающего курса" + 0.3 * Домашнее задание "Регрессионный анализ данных" + 0.3 * Домашнее задание "Факторный и кластерный анализ данных"
Список литературы

Список литературы

Рекомендуемая основная литература

  • Анализ данных : учебник для академического бакалавриата / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2016. — 490 с. — (Бакалавр. Академический курс). — ISBN 978-5-9916-5591-0. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/385663
  • Мастицкий С.Э. - Визуализация данных с помощью ggplot2 - Издательство "ДМК Пресс" - 2017 - 222с. - ISBN: 978-5-97060-470-0 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/107895
  • Мастицкий С.Э., Шитиков В.К. - Статистический анализ и визуализация данных с помощью R - Издательство "ДМК Пресс" - 2015 - 496с. - ISBN: 978-5-97060-301-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/73072

Рекомендуемая дополнительная литература

  • Brown, T. A. (2015). Confirmatory Factor Analysis for Applied Research, Second Edition (Vol. Second edition). New York: The Guilford Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=831411
  • Mäkikangas, A., Tolvanen, A., Aunola, K., Feldt, T., Mauno, S., & Kinnunen, U. (2019). Multilevel Latent Profile Analysis With Covariates : Identifying Job Characteristics Profiles in Hierarchical Data as an Example. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E3C0EDE5
  • Корнилова Т.В. - ЭКСПЕРИМЕНТАЛЬНАЯ ПСИХОЛОГИЯ 3-е изд., пер. и доп. Учебник для бакалавров - М.:Издательство Юрайт - 2016 - 639с. - ISBN: 978-5-9916-3201-0 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/eksperimentalnaya-psihologiya-387603
  • Син Такахаси - Занимательная статистика. Факторный анализ. Манга - Издательство "ДМК Пресс" - 2015 - 248с. - ISBN: 978-5-97060-116-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93563
  • Флах П. - Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных - Издательство "ДМК Пресс" - 2015 - 400с. - ISBN: 978-5-97060-273-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/69955