• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
ФИО студента
Название работы
Руководитель
Факультет
Программа
Оценка
Год защиты
Старченко Владимир Миронович
Система для извлечения структурированной информации из web-сайтов
2019
В наши дни извлечение структурированной информации из web-сайтов является довольно распространенной и востребованной задачей. Существуют различные инструменты и подходы к её решению. Есть фреймворки,позволяющие программистам написать код, извлекающий информацию. Есть также коммерческие организации, предлагающие сделать это за определенную плату. В настоящей работе мы описываем разработанную нами систему, которая позволяет пользователю без технической подготовки самому решить проблему извлечения структурированной информации. Интерфейс реализованной системы построен так, что пользователь получает доступ ко всем её функциям, совершая несложные действия в браузере. Ещё одним преимуществом разработанной архитектуры являются расширяемость и гибкость: она позволяет органично встраивать в систему произвольный пользовательский код и, таким образом, добавлять новые способы получения информации из html документов.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Расширенный поиск ВКР