• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Разработка программы автоматизированного извлечения данных из разноформатных таблиц

ФИО студента: Макарова Ксения Николаевна

Руководитель: Полесский Сергей Николаевич

Кампус/факультет: Московский институт электроники и математики им. А.Н. Тихонова

Программа: Информатика и вычислительная техника (Бакалавриат)

Оценка: 9

Год защиты: 2019

В данной работе описывается процесс разработки программы автоматизированного извлечения табличных данных из документов формата PDF в документы формата Excel. Программа была создана с целью облегчения и ускорения механической работы, выполняемой человеком, за счет использования автоматизированной процедуры обработки документов. Перед разработкой данной программы необходимо было провести анализ существующих методов и технологий извлечения табличных данных из электронных документов разных форматов, а также способов преобразования табличных данных в нужный формат. В ходе исследования были выявлены недостатки существующих технологий и разработан собственный алгоритм извлечения разноформатных таблиц из PDF-документов. В процессе работы была создана программа, которая выполняет процедуры поиска и автоматизированной обработки табличной информации из документов формата PDF, преобразование и вывод её в документы формата Excel. Объем работы составляет 53 страницы, количество иллюстраций в работе – 38. Список литературы состоит из 18 используемых источников.

Текст работы (работа добавлена 23 мая 2019 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ