• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Тематическое моделирование и решетки понятий для полуавтоматической классификации научных публикаций

ФИО студента: Никитина Полина Анатольевна

Руководитель: Игнатов Дмитрий Игоревич

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2015

Данная выпускная квалификационная работа посвящена актуальным на сегодняшний день проблемам классификации текстовых документов и представления знаний об их содержимом в компактной форме. Общий объём работы составляет 44 страницы, в который входит 10 таблиц, 6 изображений и 2 программных кода. При написании работы было использовано 25 источников информации. Цель дипломной работы заключается в том, чтобы построить распределение научных публикаций по темам, которые в них освещаются. В качестве данных для этого исследования были использованы 497 статей с конференций RecSys по рекомендательным системам, датированные 2007 – 2014 годами, а в качестве средства визуализации результатов – программа «The Concept Explorer». Для достижения обозначенной цели в работе решается ряд таких задач, как представление данных в виде бинарных матриц, построение решёток понятий, наименование тем, интерпретация полученных изображений и распределения документов по темам. Дипломная работа организована следующим образом. Во введении работы освещена её тематика, обозначены объект, предмет и методы исследования, поставлена цель и задачи по её достижению, а также пояснена актуальность затрагиваемой проблемы и значимость проделанной работы. В первой главе даны определения основных терминов, соответствующих теме работы, например, тематическое моделирование, анализ формальных понятий, решётки понятий. Вторая глава посвящена практической части исследования. В частности, она содержит описание вычислительных экспериментов для предварительной обработки данных, анализ построенных решёток понятий, а также толкование имён тем в документах. В заключении подведены итоги всего исследования и описаны полученные результаты. Приложение содержит коды написанных программ и изображения решёток понятий. Основным результатом дипломной работы можно считать тот факт, что методы анализа формальных понятий являются отличным средством при классификации текстовых документов по темам.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ