• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Версия для слабовидящихЛичный кабинет сотрудника ВШЭПоискМеню

Разработка системы автоматизации процесса скачивания библиографической информации с сайтов издательств научно-технических журналов

ФИО студента: Ахметшин Фархад Рустэмович

Руководитель: Романов Александр Юрьевич

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Информатика и вычислительная техника (Бакалавриат)

Оценка: 8

Год защиты: 2018

Настоящее исследование относится к изучению области науки по автоматизации сбора данных с веб-сайтов научных и технических журналов. В проекте проанализированы подходы существующих веб-краулеров с открытым исходным кодом и основные способы хранения собранной информации, а также создана универсальная система, взаимодействующая практически с любой структурой веб-сайта. Цель проекта – разработка универсальной системы автоматизации процесса скачивания библиографической информации с сайтов издательств научно-технических журналов. Во время реализации проекта выявлены преимущества фреймворка Scrapy, проанализирован метод локального хранения данных. Созданы программы для нескольких веб-сайтов разной структуры, после чего были обнаружены сходства в методах скачивания статей, и разработана универсальная система с использованием локального хранилища данных. Полученный программный продукт может быть использован для скачивания необходимых статей из электронных библиотек и издательств научно-технических журналов.

Текст работы (работа добавлена 14 мая 2018 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ