Магистратура
2019/2020
Методы вычислительных социальных наук в исследованиях образования
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Измерения в психологии и образовании)
Направление:
37.04.01. Психология
Кто читает:
Институт образования
Где читается:
Институт образования
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Дементьева Юлия Олеговна,
Докука София Владимировна,
Сивак Елизавета Викторовна
Прогр. обучения:
Измерения в психологии и образовании
Язык:
русский
Кредиты:
4
Контактные часы:
60
Программа дисциплины
Аннотация
Распространение цифровых технологий изменяет методологию социальных наук: дизайн исследований, источники данных, подходы к их анализу. Цифровизация многих повседневных практик позволяет собирать данные на больших выборках о самых разных аспектах жизни людей, например, социальных взаимодействиях, перемещениях, обучении, покупках. Цифровые следы и современные методы науки о данных (data science) дают возможность изучать поведение более детализированно и ставить новые вопросы. Использование новых данных требует от исследователей новой оптики, позволяющей видеть альтернативные источники данных, и новых навыков извлечения, предобработки и анализа этих данных. Цель курса —— сформировать эту оптику у магистрантов в области исследований образования. В рамках курса студенты получат представление о возможностях и ограничениях новых данных, освоят основные подходы к дизайну исследований и ключевые методы вычислительных социальных наук для работы с различными типами данных (сетевой анализ, анализ текстов, анализ геоданных), приобретут базовые навыки программирования на языке Python и разработают свой проект исследования в области вычислительных социальных наук.
Цель освоения дисциплины
- Цель освоения дисциплины «Методы науки о данных в исследованиях образования» состоит в формировании у студентов: • знаний наиболее актуальных работ в области применения новых типов данных в социальных науках и науках об образовании; • навыков по сбору данных из социальных медиа и других цифровых следов с использованием языка программирования Python; • навыков обработки и анализа различных типов данных (сетевые, текстовые и геоданные) с использованием языка программирования Python.
Планируемые результаты обучения
- Студенты формулируют исследовательские вопросы, на которые можно ответить с использованием новых данных
- Студенты обрабатывают данные разных типов
- Студенты правильно интерпретируют полученные результаты анализа данных
- Студенты называют основные ограничения новых данных (цифровых следов)
- Студенты называют основные форматы данных.
- Студенты рассчитывают описательные сетевые статистики.
- Студенты называют исследовательские вопросы, которые могут быть изучения методами сетевого анализа
- Студенты называют основные доступные для анализа публичные данные пользователей
- Студенты выбирают правильный подход к визуализации данных разных типов.
- Студенты формулируют основные понятия и принципы работы агентных моделей.
- Студенты называют этические принципы работы с новыми данными и методами
- Студенты называют ограничения новых данных (цифровых следов) и угрозы валидности и надежности в исследованиях с применением этих новых данных
- Студенты называют этические принципы и ограничения работы с новыми данными и методами
- Студенты называют основные особенности вычислительных социальных наук
- Студенты называют основные структуры данных в языке Python
- Студенты пишут циклы, условия, функции на языке Python
- Студенты называют функции для разных переменных в Python (строковых, числовых)
- Студенты загружают дополнительные пакеты в Python
- Студенты называют основные источники ошибок в исследовании
- Студенты называют основные ограничения работы с новыми данными и методами
- Студенты называют возможные этические проблемы исследований
- Студенты называют возможные способы улучшения дизайна исследования для сокращения рисков этических проблем исследования
- Студенты называют основные угрозы валидности и надежности в исследованиях с применением цифровых следов
- Студенты используют API Вконтакте
- Студенты умеют выгружать данные HTML.
- Студенты называют основные показатели социальных сетей
- Студенты называют алгоритмы сбора сетевых данных
- Студенты умеют рассчитывать сетевые показатели и пересекать их между собой
- Студенты называют основные методы анализа данных пользователей
- Студенты называют принципы агентной модели Шеллинга
- Студенты умеют запускать агентные модели в NetLogo
Содержание учебной дисциплины
- Тема 1. Что такое вычислительные социальные науки.Новые типы данных: Интернет-данные, другие цифровые следы и возможности их применения. Преимущества и ограничения. Примеры исследований.
- Тема 2. Краткое введение в Python.Переменные, списки и словари. Условия, циклы, функции.
- Тема 11. Этика использования новых данных.Обсуждение этических принципов использования новых данных, выстраивания дизайна исследования исходя из этических предпосылок.
- Тема 4. Статистический анализ в PythonОписательная статистика, регрессионный анализ, кластерный анализ.
- Тема 3. Критерии качества исследования с использованием новых типов данныхВалидность и надежность. Общая теория ошибок.
- Тема 5. Форматы данныхHTML и JSON. Использование API ВКонтакте.
- Тема 7. Анализ социальных сетей.Сети дружбы Вконтакте.
- Тема 6. Анализ социальных сетейРасчет сетевых статистик
- Тема 9. Визуализация.Визуализация данных.
- Тема 10. Агентное моделирование.Введение в агентное моделирование.
- Тема 8. Анализ текстовых данных.Анализ публичных записей пользователей.
Элементы контроля
- Домашнее задание: практические задания (выполнение заданий на Python)
- Подготовка проекта исследования
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.4 * Домашнее задание: практические задания (выполнение заданий на Python) + 0.6 * Подготовка проекта исследования
Список литературы
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G., 1995
- Kramer, A. D. I., Guillory, J. E., & Hancock, J. T. (2014). Experimental evidence of massive-scale emotional contagion through social networks. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E82A0FBC
- Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081
- Wilensky, U., & Rand, W. (2015). An Introduction to Agent-Based Modeling : Modeling Natural, Social, and Engineered Complex Systems with NetLogo. Cambridge, Massachusetts: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=976350
Рекомендуемая дополнительная литература
- Hobbs, W. R., Burke, M., Christakis, N. A., & Fowler, J. H. (2016). Online social integration is associated with reduced mortality risk. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.B2C8229
- Kosinski, M., Stillwell, D., & Graepel, T. (2013). Private traits and attributes are predictable from digital records of human behavior. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.FABDAC62
- Palchykov, V., Kaski, K., Kertész, J., Barabási, A.-L., & Dunbar, R. I. M. (2012). Sex differences in intimate relationships. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.18E869F3