• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Методы сбора информации из Web-форумов

ФИО студента: Баранов Антон Сергеевич

Руководитель: Турдаков Денис Юрьевич

Кампус/факультет: Факультет компьютерных наук

Программа: Программная инженерия (Бакалавриат)

Год защиты: 2018

Web-форумы появились на раннем этапе развития Интернета и остаются популярными по сей день. Они накапливают огромное число полезной информации, которая расположена в разных частях сети Интернет. Поэтому, пользователям требуется много времени, чтобы найти необходимые для них данные. Помимо этого, существуют несколько различных типов форумных движков, обладающих разными подходами к формированию страниц сайта и хранению данных. Целью работы является изучение методов сборов данных из Web-форумов. В данной работе исследованы различные подходы для извлечения информации из Web-форумов, предложены несколько способов извлечения атрибутов сообщения на Web-форуме. На основе полученных знаний реализован в виде программного средства метод автоматического извлечения постов пользователей со страниц обсуждений на Web-форумах, а также проанализированы результаты работы данного программного средства. Ключевые слова: веб-кроулинг, форум, извлечение информации

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ