• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Кластеризация СМИ по новостному контенту

ФИО студента: Манузина Алена Викторовна

Руководитель: Макаров Илья Андреевич

Кампус/факультет: Факультет креативных индустрий

Программа: Журналистика данных (Магистратура)

Год защиты: 2020

Алгоритмы, используемые для сравнения текстов и кластеризации СМИ на основе контента, входят во многие методы исследования отдельных изданий и медиаландшафта в целом. Они помогают сопоставлять освещение событий различными СМИ, отслеживать распространение ложной информации и предвзятость в подаче материала и могут быть полезны как исследователям, так и практикам: рекламодателям, медиаменеджерам и сотрудникам пресс-служб. В настоящей работе рассмотрены три алгоритма, их эффективность проверена на базе статей из 38 русскоязычных СМИ. Первый метод основан на сравнении места, которое различные темы занимают в вещании разных изданий; второй сопоставляет списки людей, которых медиа цитируют чаще всего; третий использует данные о наиболее характерных для издания словах, то есть тех, которые в материалах конкретного СМИ используются намного чаще, чем в языке в целом. Эти методы исследуют статьи на различных уровнях: тем, цитат как структурного компонента текста и отдельных слов. Третий метод оказался наиболее точным в кластеризации СМИ, он успешно разделяет их по основным темам, региону и положению на политическом спектре. В дополнение к сравнению алгоритмов, работа дает информацию, полученную из предобработанных данных, и показывает направление для будущих исследований.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ