• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2019/2020

Методы вычислительных социальных наук в исследованиях образования

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс по выбору (Измерения в психологии и образовании)
Направление: 37.04.01. Психология
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Преподаватели: Дементьева Юлия Олеговна, Докука София Владимировна, Сивак Елизавета Викторовна
Прогр. обучения: Измерения в психологии и образовании
Язык: русский
Кредиты: 4
Контактные часы: 60

Программа дисциплины

Аннотация

Распространение цифровых технологий изменяет методологию социальных наук: дизайн исследований, источники данных, подходы к их анализу. Цифровизация многих повседневных практик позволяет собирать данные на больших выборках о самых разных аспектах жизни людей, например, социальных взаимодействиях, перемещениях, обучении, покупках. Цифровые следы и современные методы науки о данных (data science) дают возможность изучать поведение более детализированно и ставить новые вопросы. Использование новых данных требует от исследователей новой оптики, позволяющей видеть альтернативные источники данных, и новых навыков извлечения, предобработки и анализа этих данных. Цель курса —— сформировать эту оптику у магистрантов в области исследований образования. В рамках курса студенты получат представление о возможностях и ограничениях новых данных, освоят основные подходы к дизайну исследований и ключевые методы вычислительных социальных наук для работы с различными типами данных (сетевой анализ, анализ текстов, анализ геоданных), приобретут базовые навыки программирования на языке Python и разработают свой проект исследования в области вычислительных социальных наук.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель освоения дисциплины «Методы науки о данных в исследованиях образования» состоит в формировании у студентов: • знаний наиболее актуальных работ в области применения новых типов данных в социальных науках и науках об образовании; • навыков по сбору данных из социальных медиа и других цифровых следов с использованием языка программирования Python; • навыков обработки и анализа различных типов данных (сетевые, текстовые и геоданные) с использованием языка программирования Python.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студенты формулируют исследовательские вопросы, на которые можно ответить с использованием новых данных
  • Студенты обрабатывают данные разных типов
  • Студенты правильно интерпретируют полученные результаты анализа данных
  • Студенты называют основные ограничения новых данных (цифровых следов)
  • Студенты называют основные форматы данных.
  • Студенты рассчитывают описательные сетевые статистики.
  • Студенты называют исследовательские вопросы, которые могут быть изучения методами сетевого анализа
  • Студенты называют основные доступные для анализа публичные данные пользователей
  • Студенты выбирают правильный подход к визуализации данных разных типов.
  • Студенты формулируют основные понятия и принципы работы агентных моделей.
  • Студенты называют этические принципы работы с новыми данными и методами
  • Студенты называют ограничения новых данных (цифровых следов) и угрозы валидности и надежности в исследованиях с применением этих новых данных
  • Студенты называют этические принципы и ограничения работы с новыми данными и методами
  • Студенты называют основные особенности вычислительных социальных наук
  • Студенты называют основные структуры данных в языке Python
  • Студенты пишут циклы, условия, функции на языке Python
  • Студенты называют функции для разных переменных в Python (строковых, числовых)
  • Студенты загружают дополнительные пакеты в Python
  • Студенты называют основные источники ошибок в исследовании
  • Студенты называют основные ограничения работы с новыми данными и методами
  • Студенты называют возможные этические проблемы исследований
  • Студенты называют возможные способы улучшения дизайна исследования для сокращения рисков этических проблем исследования
  • Студенты называют основные угрозы валидности и надежности в исследованиях с применением цифровых следов
  • Студенты используют API Вконтакте
  • Студенты умеют выгружать данные HTML.
  • Студенты называют основные показатели социальных сетей
  • Студенты называют алгоритмы сбора сетевых данных
  • Студенты умеют рассчитывать сетевые показатели и пересекать их между собой
  • Студенты называют основные методы анализа данных пользователей
  • Студенты называют принципы агентной модели Шеллинга
  • Студенты умеют запускать агентные модели в NetLogo
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Что такое вычислительные социальные науки.
    Новые типы данных: Интернет-данные, другие цифровые следы и возможности их применения. Преимущества и ограничения. Примеры исследований.
  • Тема 2. Краткое введение в Python.
    Переменные, списки и словари. Условия, циклы, функции.
  • Тема 11. Этика использования новых данных.
    Обсуждение этических принципов использования новых данных, выстраивания дизайна исследования исходя из этических предпосылок.
  • Тема 4. Статистический анализ в Python
    Описательная статистика, регрессионный анализ, кластерный анализ.
  • Тема 3. Критерии качества исследования с использованием новых типов данных
    Валидность и надежность. Общая теория ошибок.
  • Тема 5. Форматы данных
    HTML и JSON. Использование API ВКонтакте.
  • Тема 7. Анализ социальных сетей.
    Сети дружбы Вконтакте.
  • Тема 6. Анализ социальных сетей
    Расчет сетевых статистик
  • Тема 9. Визуализация.
    Визуализация данных.
  • Тема 10. Агентное моделирование.
    Введение в агентное моделирование.
  • Тема 8. Анализ текстовых данных.
    Анализ публичных записей пользователей.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание: практические задания (выполнение заданий на Python)
  • неблокирующий Подготовка проекта исследования
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.4 * Домашнее задание: практические задания (выполнение заданий на Python) + 0.6 * Подготовка проекта исследования
Список литературы

Список литературы

Рекомендуемая основная литература

  • Elementary statistics : a step by step approach, Bluman, A. G., 1995
  • Kramer, A. D. I., Guillory, J. E., & Hancock, J. T. (2014). Experimental evidence of massive-scale emotional contagion through social networks. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E82A0FBC
  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081
  • Wilensky, U., & Rand, W. (2015). An Introduction to Agent-Based Modeling : Modeling Natural, Social, and Engineered Complex Systems with NetLogo. Cambridge, Massachusetts: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=976350

Рекомендуемая дополнительная литература

  • Hobbs, W. R., Burke, M., Christakis, N. A., & Fowler, J. H. (2016). Online social integration is associated with reduced mortality risk. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.B2C8229
  • Kosinski, M., Stillwell, D., & Graepel, T. (2013). Private traits and attributes are predictable from digital records of human behavior. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.FABDAC62
  • Palchykov, V., Kaski, K., Kertész, J., Barabási, A.-L., & Dunbar, R. I. M. (2012). Sex differences in intimate relationships. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.18E869F3