• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Моделирование жанрово-тематической направленности текста для автоматического выявления рекламы

ФИО студента: Никифорова Анастасия Владимировна

Руководитель: Малафеев Алексей Юрьевич

Кампус/факультет: Факультет гуманитарных наук (Нижний Новгород)

Программа: Фундаментальная и прикладная лингвистика (Бакалавриат)

Год защиты: 2018

В настоящее время существует множество различных тематических моделей. Широко известные методы вероятностного латентного семантического анализа (PLSA) (Hofmann 1999) и скрытое распределение Дирихле (LDA) (Blei et al., 2003) являются универсальными и различают темы, соответствующие широким тематическим областям. Тем не менее, модель темы в настоящем исследовании должна автоматически идентифицировать отличительные термины предопределенных жанров. Поэтому используется модель с регулируемой темой, поскольку она фокусируется на определении тем, которые позволяют разделить документы на соответствующие и нерелевантные классы (Rubin 2012). Несмотря на множество научных публикаций по тематическому моделированию, ни одна из них не применяет тематические модели для определения коммерческих текстов. Именно поэтому целью настоящего исследования является разработка алгоритма классификации жанров на основе тематического моделирования автоматического обнаружения рекламы. Исследование решает несколько задач, таких как создание пользовательского корпуса текстов, ручная классификация тестового образца как прошлое полуконтролируемого процесса машинного обучения, создание тематической модели для будущей классификации текстов вне корпуса, оценка модели и анализируя результаты автоматического обнаружения рекламы.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ