• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Итеративное построение графовых эмбеддингов и кластеризации

ФИО студента: Оборевич Артем Аркадьевич

Руководитель: Макаров Илья Андреевич

Кампус/факультет: Факультет компьютерных наук

Программа: Статистическая теория обучения (Магистратура)

Год защиты: 2021

Как правило, построение графовых эмбеддингов есть ничто иное как трансформация общепринятого представления графа, как например матрица смежности, в некоторое компактное векторное пространство, где каждой вершине графа ставится в 1-1с соответствие определенный вектор, полученный из анализа заданного графа. Такое геометрическое представление является очень удобным, так как позволяет нам перейти от абстрактного представления графа к классическому векторному представлению, что очень удобно для дальнейшего использования классических методов машинного обучения. Одной из задач, связанных с анализом графов, является задача представления графа на плоскости с сохранением структурных особенностей графа, которые должны быть сохранены при процессе трансформации графа в эмбеддинговое пространство. Одной из таких структурных особенностей является презервация расстояний между вершинами графа и их плотность распределения. Традиционные алгоритмы не всегда позволяют установить такие связи на основе более высокого иерархического слоя, каким является уровень сообществ в графе. Однако в недавних работах было показано, что исследование графовых сообществ позволяет лучше передать свойства близости и расстояний между отдельными вершинами. И наоборот, эмбеддинг, сохранивший в себе информацию о близости отдельных вершин позволяет улучшить качество кластеризации и нахождение сообществ в графе. Иными словами, было показано что решение дуальной задачи трансформации графа в эмбеддинговое пространство и нахождение сообществ при условии совместного разделения информации позволяет улучшить метрики как первой проблемы, так и второй. Главной задачей нашей работы является исследование таких гибридных методов с целью установления их сильных сторон, а также исследование их дальнейшего потенциала. В нашей работе мы сравниваем итеративные алгоритмы построения графовых эмбеддингов и кластеризации с классическими методами решения этих проблем по отдельности и проводим сравнительный анализ. В качестве результата мы представляем модель, которая превосходит предыдущие итеративные методы, которые решают каждую из проблем по отдельности.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ