• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Идентификация пользователей по посещённым веб-страницам

ФИО студента: Рогова Дарья Юрьевна

Руководитель: Бекларян Армен Левонович

Кампус/факультет: Высшая школа бизнеса

Программа: Бизнес-информатика (Бакалавриат)

Год защиты: 2018

Данная выпускная квалификационная работа посвящена исследованию методов интеллектуального анализа данных использования веб-ресурсов (далее – Web Usage Mining). В частности, была рассмотрена малоизученная по этому направлению задача по идентификации пользователей. Цель работы заключалась в разработке модели с помощью методов интеллектуального анализа данных для идентификации пользователей на основе посещённых веб-страниц. Задачи исследования включали в себя: 1. Изучение теоретических аспектов методов Web Usage Mining. 2. Определение подходящих техник для обработки данных. 3. Выбор оптимального алгоритма кластеризации для извлечения паттернов взаимодействия пользователей с веб-ресурсами. 4. Проведение сравнительного анализа нескольких классификаторов. Информационная база исследования состояла из записей лог-журналов, содержащих данные о взаимодействии с веб-ресурсами 3370 пользователей за шестимесячный период. Практическая часть работы – реализация нового метода идентификации пользователей, основанного на традиционных методах интеллектуального анализа данных и техниках извлечения знаний из веб-ресурсов и текстовых документов. Разработка модели осуществлялась по методологии CRISP-DM и состояла из трёх этапов: первичного анализа данных, подготовки данных и моделирования. Экспериментальное исследование включало не только различные подходы к моделированию данных и ансамблированию моделей, но и современные методы онлайн-обучения для обработки большого объёма данных. В ходе кластерного анализа были получены обобщённые профили, демонстрирующие наиболее распространённые шаблоны использования веб-ресурсов. Полученные в работе результаты имеют весомую практическую значимость для решения проблемы идентификации пользователей и могут быть использованы в ряде направлений: при разработке инструментов информационной безопасности, в рекомендательных системах и маркетинговых исследованиях. Ключевые слова: интеллектуальный анализ данных, машинное обучение, веб-ресурсы.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ