• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Поиск трикластеров близких значений в многозначных триадических контекстах

ФИО студента: Егурнов Дмитрий Алексеевич

Руководитель: Игнатов Дмитрий Игоревич

Кампус/факультет: Отделение прикладной математики и информатики

Программа: Бакалавриат

Год защиты: 2014

<h1>Аннотация</h1><p>Разработка триадических данных в наши дни приобретает всё большую актуальность. В то время как для решения задач кластеризации в бинарных диадических, бинарных триадических и многозначных диадических контекстах существует довольно много эффективных методов, лишь некоторые из них можно расширить на многозначный триадический случай.</p><p>В данной работе автор ставит целью разработку и исследование нескольких алгоритмов для трикластеризации вещественных данных в многозначных триадических контекстах, основываясь на методах ОАС-трикластеризации (Object, Attribute, Condition), сравнение эффективности работы этих алгоритмов, а также обработку ими реальных данных и интерпретацию результатов.</p><p>В ходе разработки новых алгоритмов были рассмотрены уже существующие методы, решающие близкие задачи, а именно: ОАС-трикластеризация, основанная на штрих-операторах, метод Шкалирования Формальных Понятий (Conceptual Scaling) и его реализация TriMax, а также метод Внитрипорядкового Шкалирования (Interordinal Scaling). По различным причинам они не могли быть напрямую использованы для решения поставленной в данной работе задачи, поэтому автор предлагает два метода для поиска трикластеров близких значений в многозначных триадических контекстах: NOAC (Numerical OAC), являющийся расширением на многозначный случай ОАС-трикластеризации, основанной на штрих-операторах, и классический алгоритм кластеризации К-Средних (KMEANS) использующий авторскую метрику для вычисления расстояний.</p><p>Работа предложенных алгоритмов проверялась на двух наборах данных: машинно-генерируемые контексты, включающие эксперименты на общую работоспособность, устойчивость к шуму и потери значений, и данные проекта GroupLens, собравшего результаты оценивания анонимизированными пользователями различных фильмов на веб сайте MovieLens (<a href="http://movielens.org/">http://movielens.org</a>).</p><p>Сравнение алгоритмов проводилось по показателям плотности, разнообразия и покрытия множества исследуемых сущностей как одиночных трикластеров, так и всего результирующего набора. Также учитывалось время работы. Эксперименты проводились для различных наборах &nbsp;параметров алгоритмов с целью выявить оптимальную настройку.</p><p>Результаты проведённых экспериментов продемонстрировали превосходство предложенного алгоритма NOAC над адаптированным методом К-Средних по большинству показателей качества поиска.</p><p><strong>Ключевые слова</strong>: кластеризация, трикластеризация, OAC-трикластеризация, вещественные данные, трикластер близких значений, многозначный контекст.</p><p>&nbsp;</p>

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ