• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Система для извлечения структурированной информации из web-сайтов

ФИО студента: Старченко Владимир Миронович

Руководитель: Сухорослов Олег Викторович

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2019

В наши дни извлечение структурированной информации из web-сайтов является довольно распространенной и востребованной задачей. Существуют различные инструменты и подходы к её решению. Есть фреймворки,позволяющие программистам написать код, извлекающий информацию. Есть также коммерческие организации, предлагающие сделать это за определенную плату. В настоящей работе мы описываем разработанную нами систему, которая позволяет пользователю без технической подготовки самому решить проблему извлечения структурированной информации. Интерфейс реализованной системы построен так, что пользователь получает доступ ко всем её функциям, совершая несложные действия в браузере. Ещё одним преимуществом разработанной архитектуры являются расширяемость и гибкость: она позволяет органично встраивать в систему произвольный пользовательский код и, таким образом, добавлять новые способы получения информации из html документов.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ