• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Версия для слабовидящихЛичный кабинет сотрудника ВШЭПоискМеню

Онлайн-коммуникация: когнитивные лимиты и методы автоматического анализа

Приоритетные направления развития: социология, гуманитарные науки, компьютерно-математическое, математика
2020
Руководитель: Кольцова Елена Юрьевна, Штааб Штеффен Рудольф

Цель работы

Будучи междисциплинарным ансамблем, проект включает в себя две части со смежными целями.

  1. проверить наличие феномена социального почерка в текстовой онлайн-коммуникации, его связь с когнитивными лимитами и некоторыми характеристиками контрагентов коммуникации; 
  2. с учетом знаний об особенностях восприятия текстовой информации людьми адаптировать энтропийный подход к настройке и оценке тематических моделей к иерархическим тематическим моделям и их применению в социальных и гуманитарных науках. 

Используемые методы:

  1. корреляционный, многоуровневый регрессионный анализ;
  2. поиск необходимых математических формулировок и эксперименты с алгоритмами машинного обучения (HLDA, HPAM, hARTM).

Эмпирическая база исследования

(1) Тестирование гипотез первого подпроекта производилось на онлайн-данных пользователей социальной сети Вконтакте, представленных в двух наборах данных и собранных в рамках исследования прошлого года. Первый датасет содержит данные о направленной онлайн-коммуникации 39 пользователей Вконтакте со своими друзьями, некоторые опросные данные, включающие ответы респондентов о характере взаимоотношений с каждым из своих онлайн друзей (суммарно около 16 тыс. друзей), и данные о полных эго-сетях респондентов. Датасет 2 помимо данных об онлайн-коммуникации пользователей со своими друзьями содержит ответы 89 респондентов на психологический опросник “Большая пятерка” и ценностный опросник Ш. Шварца. 

(2) Для экспериментов использованы шесть коллекций текстов: русскоязычная “Lenta” (n = 8 630), размеченная пользователями на 10 тем; англоязычная “20 Newsgroups” (n = 15 425), размеченная пользователями на 20 тем; англоязычная “WoS” (n = 46 985), имеющая иерархическую разметку (на первом уровне -- 7 тем, на втором -- 134); сбалансированная версия “WoS” (n = 11 967, 7 и 33 темы); англоязычная “Amazon” (n = 40 000; 6, 64 и 510 категорий); сбалансированная “Amazon” (n = 32 774; 6 и 27 категорий).

Результаты работы

(1) Эмпирически был протестирован феномен социального почерка. В результате не было обнаружено устойчивых во времени паттернов коммуникации пользователей со своими контрагентами. Кроме того, оказывается, что, несмотря на особую специфику коммуникации, социальные сети не позволяют пользователю расширять размер сети активных контактов, и количество партнеров по личной переписке также не превышает обозначенного Р. Данбаром когнитивного лимита. Дополнительно в исследовании обозначаются психологические механизмы, определяющие некоторые аспекты коммуникации пользователей со своими контрагентами.

(2) Сформулирован принцип расчета энтропии Реньи для иерархических тематических моделей. На основе результатов вычислительных экспериментов сформулированы рекомендации для использования иерархических тематических моделей в решении задач социальных и гуманитарных наук.

Рекомендации и область применения:

(1) Полученные результаты могут быть использованы как основа для рекомендаций при проектировании коммуникационных систем. Кроме того, результаты об особенностях онлайн коммуникации в социальных сетях могут применяться в маркетинговых целях.

(2) Для исследований в социальных и гуманитарных науках, сфокусированных на иерархии в тематической структуре текстовых данных, рекомендуется использовать алгоритм hARTM, настроенный с использованием разработанных на основе энтропии Реньи метрик. 

Публикации по проекту:


Koltcov S., Ignatenko V. Renormalization Analysis of Topic Models // Entropy. 2020. Vol. 22. No. 5. P. 1-23. doi
Koltsova O., Alexeeva S., Pashakhin S., Koltsov S. PolSentiLex: Sentiment Detection in Socio-political Discussions on Russian Social Media, in: Artificial Intelligence and Natural Language. AINL 2020. Communications in Computer and Information Science.: Springer, 2020. С. 1-16. 
Koltsova O., Porshnev A., Sinyavskaya Y. Social Media-based Research of Interpersonal and Group Communication in Russia, in: The Palgrave Handbook of Digital Russia Studies.: Palgrave Macmillan, 2021. С. 335-352. 
Moroz A., Pashakhin S., Koltsov S. Modeling Cascade Growth: Predicting Content Diffusion on VKontakte, in: Networks in the Global World V: Proceedings of NetGloW 2020. Lecture Notes in Networks and Systems.: Springer, 2021. С. 180-195. 
Sinyavskaya Y., Porshnev A. Friends network expansion and reduction: investigating the role of structural and psychological factors, in: Networks in the Global World V: Proceedings of NetGloW 2020. Lecture Notes in Networks and Systems.: Springer, 2021. С. 196-208.