• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Подход к выявлению аномалий в данных об использовании веб-сайтов

ФИО студента: Носовский Михаил Михайлович

Руководитель: Дегтярев Константин Юрьевич

Кампус/факультет: Факультет компьютерных наук

Программа: Программная инженерия (Бакалавриат)

Год защиты: 2020

Поисковые системы стали основным способом получения информации и, таким образом, важной частью повседневной жизни людей. Следовательно, в сфере поисковых систем вращаются огромные суммы денег, что неизбежно приводит к появлению людей, которые пытаются получить из этого прибыль. Помимо честных пользователей, есть и примеры мошеннического поведения, направленного на обман самих поисковых систем и/или других пользователей. Поэтому необходимо каким-то образом выявлять этих злоумышленников. Тем не менее, примеров мошенничества, как правило, мало в сравнении с примерами хорошего поведения, что позволяет рассматривать нечестных пользователей как аномалии и применять методы обнаружения аномалий. В статье предлагается новый подход к выявлению плохих пользователей путем выявления плохих сущностей, в частности, веб-сайтов, связанных с этими пользователями, а также производится сравнительный существующих алгоритмов обнаружения аномалий. В рамках работы интернет моделируется как двудольный граф “пользователь-сущность”, что позволяет перейти от выявления плохих пользователей к выявлению плохих сущностей. Чтобы разработать этот подход, мы сначала вводим определение термина “аномалия”, проводим краткий сравнительный анализ различных методов выявления аномалий и выбираем несколько кандидатов с учетом специфики используемых данных (dataset). Затем мы реализуем выбранные алгоритмы и эмпирически оцениваем их на реальных данных, касающихся использования веб-сайтов и содержащих порядка одного миллиона объектов. В итоге, на основе полученных экспериментальных результатов выбирается подходящий метод для решения поставленной задачи на используемых данных. Работа содержит 85 страниц, 3 главы, 33 рисунка, 2 таблицы, 143 источника и 4 приложения.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ