• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Версия для слабовидящихЛичный кабинет сотрудника ВШЭПоиск
Бакалавриат 2019/2020

Научно-исследовательский семинар: Анализ и визуализация данных в психологии

Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Психология)
Направление: 37.03.01. Психология
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Язык: русский
Кредиты: 3

Программа дисциплины

Аннотация

Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 37.03.01 - «Психология» подготовки бакалавра, изучающих дисциплину «Научно-исследовательский семинар Анализ и визуализация данных в психологии». Программа разработана в соответствии с: • Оригинальным образовательным стандартом НИУ ВШЭ по направлению 37.03.01 «Психология»; • Образовательной программой 37.03.01 «Психология»; • Рабочим учебным планом университета по направлению 030300.62 «Психология» подготовки бакалавра, утверждённым в 2019 г Целями освоения дисциплины «Научно-исследовательский семинар Анализ и визуализация данных в психологии» являются: • освоение основных методов многомерного статистического анализа данных психологических исследований (регрессионный анализ, эксплораторный и конфирматорный факторный анализ, кластерный анализ); • освоение практических навыков многомерной статистической обработки эмпирических данных с использованием компьютерных программ (программная среда R); • освоение практических навыков визуализации данных (программная среда R). Формы текущего контроля - домашние задания: "Визуализация данных", "Критическая оценка результатов регрессионного анализа", "Прохождение интерактивного обучающего курса", "Регрессионный анализ данных", "Факторный и кластерный анализ данных". Промежуточный контроль - взвешенная сумма оценок по текущему контролю.
Цель освоения дисциплины

Цель освоения дисциплины

  • освоение основных методов многомерного статистического анализа данных психологических исследований
  • освоение практических навыков многомерной статистической обработки эмпирических данных с использованием компьютерных программ
  • освоение практических навыков визуализации данных с использованием компьютерных программ
Планируемые результаты обучения

Планируемые результаты обучения

  • Осуществляет поиск дополнительной информации, необходимой для уточнения параметров статистической обработки данных
  • Под научным руководством осуществляет обработку и визуализацию данных количественными методами с использованием современного программного обеспечения
  • Осуществляет визуализацию данных с использованием современного программного обеспечения
  • Под научным руководством дает содержательную интерпретацию полученным результатам количественного анализа данных, способен осмыслить полученные результаты в общем академическом контексте исследуемой проблематики
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Общее представление о многомерных методах статистического анализа данных
    Теоретические, эмпирические и статистические гипотезы. Квазиэкспериментальные исследования и статистические методы анализа данных. Многомерные статистические методы анализа данных: область применения, цели, результаты. Статистическая достоверность выводов на выборке относительно генеральной совокупности. Процедура статистического вывода: понятие статистического критерия, виды гипотез, понятия уровня значимости, ошибок I и II рода. Проблема статистической мощности анализа, её связь с методом проверки гипотез, размером эффекта, объёмом выборки, критерием принятия решений.
  • R - программный язык для анализа и визуализации данных
    Базовые принципы синтаксиса R. Загрузка и трансформация данных в R. Базовые операции программирования в R.
  • Визуализация данных
    Основные виды графического преставления распределений: гистограммы, кривые плотности вероятности, box-plots и т.д. Диаграммы рассеяния и линии тренда как визуализация отношений между исследуемыми переменными. Пакет R ggplot2: визуализация данных
  • Регрессионный анализ данных
    Цели и задачи регрессионного анализа данных. Базовые математические основания регрессионного анализа. Множественная линейная регрессия. Оценка качества линейных регрессионных моделей. Интерпретация результатов линейного регрессионного анализа данных. Биномиальная регрессия. Оценка качества биномиальных регрессионных моделей. Интерпретация результатов биномиального регрессионного анализа данных. Реализация регрессионного анализа данных в программной среде R. Нормативы представления результатов регрессионного анализа данных в научном отчете.
  • Введение в машинное обучение
    Основные принципы и типы машинного обучения. Реализация базовых моделей машинного обучения в программной среде R.
  • Эксплораторный факторный анализ данных
    Цели и задачи эксплораторного факторного анализа данных. Базовые математические основания эксплораторного факторного анализа. Оценка качества результатов эксплораторного факторного анализа. Интерпретация результатов эксплораторного факторного анализа данных. Реализация эксплораторного факторного анализа данных в программной среде R. Нормативы представления результатов эксплораторного факторного анализа данных в научном отчете.
  • Кластерный анализ данных
    Цели и задачи кластерного анализа данных. Базовые математические основания кластерного анализа. Оценка качества результатов кластерного анализа. Интерпретация результатов кластерного анализа данных
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание "Прохождение интерактивного обучающего курса"
    Задание выполняется индивидуально. В качестве контроля самостоятельной работы по освоению программного языка R необходимо выполнить интерактивный курс R Programming пакета swirl. Данный курс содержит 15 тематических блоков. Отчетность осуществляется в форме сдачи текстовой копии консоли с подтверждением авторства (в электронном виде).
  • неблокирующий Домашнее задание "Визуализация данных"
    Задание выполняется в группах (не больше 5 человек). Студенты получают набор данных и 5 вопросов к этим данным, на которые надо ответить, построив соответствующие графики.
  • неблокирующий Домашнее задание "Критическая оценка результатов регрессионного анализа"
    Задание представляет собой анализ научной статьи. Задание выполняется индивидуально, при этом выбранные статьи не должны повторяться среди студентов одного курса. В качестве статьи может быть выбрана работа на любую тему, однако в ней должен быть представлен регрессионный анализ эмпирических данных. Подходящими являются статьи на русском либо английском языке, опубликованные в научных журналах, входящих хотя бы в один из списков: WoS, Scopus, ВАК, опубликованные не ранее 2000 г. Необходимо 1) Выбрать любую научную статью по психологии, в которой представлены результаты линейного регрессионного анализа. 2) Описать результаты применения регрессионного анализа в статье. 3) Оценить возможности применения регрессионного анализа к данным, представленным в статье (размер выборки, мультиколлинеарность, связь между предикторами и зависимой переменной). 4) Оценить соответствия применения регрессионного анализа целям и гипотезам, заявленным в статье (насколько содержательно в данном дизайне необходим регрессионный анализ). 5) Оценить, насколько корректно представлены результаты регрессионного анализа в исследовании (все ли необходимые параметры фита и коэффициенты представлены; если нет - то какие вопросы к анализу это вызывает). 6) Оценить корректность авторских выводов из результатов регрессионного анализа данных (насколько сделанные авторами выводы соответствуют полученным статистическим результатам). Задание сдается в виде pdf-файла.
  • неблокирующий Домашнее задание "Регрессионный анализ данных"
    Задание представляет собой самостоятельный регрессионный анализ данных и описание полученных результатов. Задание выполняется индивидуально. На любом наборе данных необходимо построить и описать две модели: Для линейной регрессии: 1) Выбрать зависимую переменную и предикторы и описать предполагаемую линейную модель. 2) Провести анализ статистической мощности выборки для проверки предполагаемой линейной модели. Результаты оценки статистической мощности описать. 3) Оценить и описать наличие угрозы мультиколлинеарности (связи между предикторами). Если угроза есть, предложить и реализовать способы устранения этой угрозы до основного анализа. 4) Провести линейный регрессионный анализ по предложенной модели. Описать результаты линейной регрессии (параметры fit и содержательная интерпретация). 5) Провести и описать диагностический анализ модели пост-фактум (графики распределения остатков, влиятельные наблюдения и т.д.). 6) Сделать заключение - общий вывод о качестве проверяемой модели и возможных коррекциях. Для биномиальной регрессии: 7) Выбрать зависимую переменную и предикторы и описать предполагаемую биномиальную модель. 8) Провести биномиальный регрессионный анализ по предложенной модели. Описать результаты биномиальной регрессии (обоснование критерия, анализ confusion matrix и содержательная интерпретация предикторов). 9) Сделать заключение - общий вывод о качестве проверяемой модели и возможных коррекциях. Домашнее задание сдается в виде 3 файлов: отчет в формате pdf + скрипт в R + файл данных * примеры открытых источников данных: https://www.springboard.com/blog/free-public-data-sets-data-science-project/ https://openpsychometrics.org/_rawdata/
  • неблокирующий Домашнее задание "Факторный и кластерный анализ данных"
    1) Выполнить эксплораторный факторный анализ данных: а) проанализировать корреляционную структуру имеющегося набора данных; б) оценить возможности применения эксплораторного факторного анализа для обработки имеющегося набора данных; в) описать результаты применения эксплораторного факторного анализа; г) содержательно проинтерпретировать результаты эксплораторного факторного анализа; д) визуализировать результаты эксплораторного факторного анализа 2) Выполнить эксплораторный кластерный анализ данных: а) описать результаты применения кластерного анализа; б) визуализировать результаты кластерного анализа; в) содержательно проинтерпретировать результаты кластерного анализа Домашнее задание сдается в виде 3 файлов: отчет в формате pdf + скрипт в R + файл данных * примеры открытых источников данных: https://www.springboard.com/blog/free-public-data-sets-data-science-project/ https://openpsychometrics.org/_rawdata/
  • неблокирующий Мини-контрольные тесты на каждом занятии
    На каждом занятии студентам будет предлагаться мини-тест из 3-5 вопросов по пройденному материалу с ограничением времени (из расчета 1 минута на 1 вопрос).
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.15 * Домашнее задание "Визуализация данных" + 0.15 * Домашнее задание "Критическая оценка результатов регрессионного анализа" + 0.1 * Домашнее задание "Прохождение интерактивного обучающего курса" + 0.25 * Домашнее задание "Регрессионный анализ данных" + 0.25 * Домашнее задание "Факторный и кластерный анализ данных" + 0.1 * Мини-контрольные тесты на каждом занятии
Список литературы

Список литературы

Рекомендуемая основная литература

  • Анализ данных : учебник для академического бакалавриата / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2016. — 490 с. — (Бакалавр. Академический курс). — ISBN 978-5-9916-5591-0. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/385663
  • Мастицкий С.Э. - Визуализация данных с помощью ggplot2 - Издательство "ДМК Пресс" - 2017 - 222с. - ISBN: 978-5-97060-470-0 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/107895
  • Мастицкий С.Э., Шитиков В.К. - Статистический анализ и визуализация данных с помощью R - Издательство "ДМК Пресс" - 2015 - 496с. - ISBN: 978-5-97060-301-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/73072

Рекомендуемая дополнительная литература

  • Корнилова Т.В. - ЭКСПЕРИМЕНТАЛЬНАЯ ПСИХОЛОГИЯ 3-е изд., пер. и доп. Учебник для бакалавров - М.:Издательство Юрайт - 2016 - 639с. - ISBN: 978-5-9916-3201-0 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/eksperimentalnaya-psihologiya-387603
  • Син Такахаси - Занимательная статистика. Факторный анализ. Манга - Издательство "ДМК Пресс" - 2015 - 248с. - ISBN: 978-5-97060-116-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93563
  • Флах П. - Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных - Издательство "ДМК Пресс" - 2015 - 400с. - ISBN: 978-5-97060-273-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/69955