• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Оценка социальной силы в Интернете на примере данных сети «Одноклассники»: сравнение алгоритмов поиска сообществ и влияния демографических факторов

ФИО студента: Юдина Анна Сергеевна

Руководитель: Сироткин Александр Владимирович

Кампус/факультет: Санкт-Петербургская школа экономики и менеджмента

Программа: Анализ больших данных в бизнесе, экономике и обществе (Магистратура)

Год защиты: 2018

Точный и быстрый поиск сообществ на графах виртуальных социальных сетей является одной из самых важных задач анализа сетевых взаимодействий между людьми, так как ее решение находит практическое применение во многих сферах от оптимизации таргетированной рекламы до выявления распространения спама. Сегодня платформы виртуальных социальных сетей и средства анализа данных позволяют получать не только информацию о демографии пользователей, но также и данные об их интересах, кругах общения и социальной активности. Очевидным фактом является то, что пользователи могут иметь большой круг интересов, поэтому возникает необходимость выявления пересекающихся сообществ. Также важным аспектом является устойчивость алгоритмов к частичному отсутствию информации о пользователях в силу особенности виртуальных социальных сетей и тенденции пользователей не указывать либо скрывать часть данных. Обычно тестирование работы алгоритмов выделения сообществ производится на специальных синтетически сгенерированных классах графов. Однако такая проверка работы алгоритмов не является полностью корректной для многих последних разработанных методов, так как реальные социальные сети характеризуются неравномерным распределением степеней вершин и самих сообществ. Поэтому, целью данной работы является проверка того, насколько эффективно работают последние разработанные алгоритмы выделения сообществ и их сравнительный анализ на реальных данных русскоязычного сегмента виртуальной социальной сети «Одноклассники», учитывая такую информацию, как частота контактов между пользователями, тип отношений между ними, демографические факторы и данные о членстве в группах. В исследовании предпринята попытка оценить качество работы самых эффективных на сегодняшний день алгоритмов поиска сообществ CESNA и BigCLAM и провести их сравнительный анализ, а также выявить влияние демографических атрибутов вершин на образование сообществ. Также выполнено предсказание отсутствующих атрибутов вершин.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ