• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Построение векторной модели текстовой информации для анализа критерия выявления нелегальных сайтов, предлагающих микрофинансовые услуги

ФИО студента: Дмитриева Анастасия Вячеславовна

Руководитель: Жукова Людмила Вячеславовна

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Прикладная математика (Бакалавриат)

Оценка: 10

Год защиты: 2021

На сегодняшний день наблюдается стремительный рост объема мошеннических операций в области финансовых услуг населению, в частности большую долю в этом объеме занимают интернет-платежи, а также мошеннические Интернет-ресурсы, что делает задачу распознавание нелегальных веб-сайтов, предлагающих микрофинансовые услуги, наиболее актуальной. В данной работе проводится исследование предлагаемого критерия для выявления мошеннических финансовых услуг, основанный на анализе неструктурированных признаков, характеризующих содержимое подозрительных веб-ресурсов. Характеристики формируются на основе неструктурированных данных – текстовой информации, собранной с исследуемых онлайн-ресурсов. В ходе работы проведен сравнительный анализ моделей векторного представления текстовых данных, а именно модели, основанной на матрице положительной поточечной взаимной информации, Word2Vec и Doc2Vec. В дальнейшем был построен бинарный классификатор полученных представлений текстовых данных машиной опорных векторов. Для проверки эффективности построенной модели была использована перекрестная проверка, а также вычислены метрики качества классификации. Построенный в ходе работы алгоритм позволяет вычислять мошеннические веб-ресурсы, предлагающие микрофинансовые услуги, на основе текстовой информации с долей правильных ответов в 98,3%, что говорит об эффективности предлагаемой методики.

Текст работы (работа добавлена 30 мая 2021 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ