• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Система поддержки построения справочно-поисковых средств для научно-технических текстов

ФИО студента: Иванов Кирилл Михайлович

Руководитель: Большакова Елена Игоревна

Кампус/факультет: Факультет компьютерных наук

Программа: Прикладная математика и информатика (Бакалавриат)

Год защиты: 2015

В связи с постоянным увеличением объема научно-технической литературы проблема ориентации в ней является одной из наиболее острых в современном мире. Для быстрого поиска детальной информации в текстах документов используются справочно-поисковые средства, к которым относятся предметные указатели и глоссарии. Предметный указатель представляет собой перечень основных терминов, терминологических словосочетаний и названий объектов предметной области текстового документа, и существенно облегчает ориентировку в содержании работы, указывая, где и что можно найти на ее страницах. Глоссарий– перечень основных терминов текста с указанными для них определениями и толкованиями. Как правило, построение справочно-поисковых средств происходит в три этапа. На первом этапе из документа извлекаются необходимые текстовые объекты. Второй этап построения состоит в формировании определенной структуры, в зависимости от вида справочно-поискового средства. Третий этап – редактирование полученной структуры. Первый этап является основной и самой трудоемкой задачей при ручном построении справочно-поисковых средств, поэтому ведутся активные исследования по автоматизации данного процесса. В данной работе приводится краткий обзор известных методов построения глоссариев и предметных указателей. Подробно описывается разработанная система построения справочно-поисковых средств для текстов на русском языке, базирующаяся на лингвистических шаблонах и специальных правилах фильтрации автоматически извлеченных из текста терминов-кандидатов. Разработанная система направлена на обработку электронных научно-технических текстов на русском языке в формате PDF и DOCX. Пользовательский интерфейс, разработанный на базе технологии C# WPF (Windows Presentation Foundation), даёт пользователю возможность редактировать полученные справочно-поисковые средства, а также производить быструю навигацию по терминам текста.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ