• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Использование сочетания различных типов данных для рекомендации каналов

ФИО студента: Кощенко Екатерина Васильевна

Руководитель: Москвин Денис Николаевич

Кампус/факультет: Санкт-Петербургская школа физико-математических и компьютерных наук

Программа: Программирование и анализ данных (Магистратура)

Год защиты: 2021

Коллаборационные платформы, такие как GitHub и Slack, являются важными инструментами в работе сотрудников IT компаний. Данные, которые они агрегируют, могут быть использованы для построения различных алгоритмов социо-технической поддержки пользователей, упрощающих процесс работы сотрудников компаний. Однако, распределенность этих данных по разным платформам приводит к тому, что их объединения является трудоёмким процессом, в связи с чем существующие алгоритмы социо-технической поддержки (такие как рекомендация каналов в мессенджерах) основываются лишь на данных, напрямую связанных с целью алгоритмов. В данной работе был собран датасет, содержащий в себе данные о взаимодействиях сотрудников компании JetBrains в каналах и репозиториях платформы Space, репозиториях GitHub, а также позиции пользователей в компании, полученные с помощью Space. На основе полученного датасета были построены несколько видов систем рекомендации каналов в Space, основанных на разных комбинациях модальностей. Лучшие из построенных моделей были объединены в одну мультимодальную систему рекомендации. Хотя оценка работы этой мультимодальной системы на исторических данных показала худшие метрики по сравнению с лучшим из унимодальных алгоритмов (матричная факторизация на каналах), пользователи Space оценили рекомендованные мультимодальной системой каналы значительно лучше, чем рекомендации матричной факторизации. По результатам работы был сделан вывод, что использование данных о структуре организации и технических репозиториях пользователей позволяет бороться с переобучением системы рекомендации, а также решает проблему холодного старта пользователей. Ключевые слова: алгоритмы социо-технической поддержки, система рекомендации каналов, мультимодальные данные.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ