• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Чтение Геркуланумских свитков

ФИО студента: Булыгин Глеб Александрович

Руководитель: Макаров Илья Андреевич

Кампус/факультет: Факультет компьютерных наук

Программа: Машинное обучение и высоконагруженные системы (Магистратура)

Оценка: 10

Год защиты: 2025

Геркуланумские папирусы, уникальное культурное наследие античного мира, долгое время оставались недоступным для исследования из-за своего физического состояния: многовековое воздействие вулканического пепла превратило свитки в хрупкие углеродизированные объекты, попытки разворачивания которых приводили к их разрушению. Благодаря двум десятилетиям исследований группы доктора Уильяма Силса, а также недавним технологическим прорывам в области рентгеновской компьютерной томографии и машинного обучения, стало возможным неразрушающее изучение их содержимого. Полученные КТ снимки папирусов стали основой для международного конкурса по их прочтению, Vesuvius Challenge. Целью данной работы является систематизация информации о процессе распознавания чернил, а также попытка найти новые следы чернил в папирусах. Приведено подробное описание всех этапов предобработки и анализа папирусов. В рамках экспериментальной части описан процесс формирования обучающего набора данных, исследованы модификации архитектуры TimeSformer и подходы к обработке входных данных, изучено влияние объема датасета на качество предсказаний, включая использование данных из разных свитков. Исследованы подходы на основе SSL для изучения возможности идентификации наличия чернил в сложных участках папируса без существующей разметки. Полученные результаты экспериментов демонстрируют потенциал улучшения обнаружения чернил за счет расширения набора данных, несмотря на ограниченную доступность разметки и высокую вычислительную сложность задачи. Предложена модификация модели TimeSformer, показывающая значительный прирост в качестве распознавании чернил относительно существующего решения. Работа вносит вклад в развитие методов цифровой реставрации исторических артефактов, предлагая подходы, которые могут быть применены к аналогичным задачам в области культурного наследия, а также при работе со сложными 3D данными. Все результаты работы основаны на использовании открытого набора данных EduceLab-Scrolls, который включает КТ-сканы целых рулонов папирусов и отдельных фрагментов.

Текст работы (работа добавлена 23 мая 2025 г.)

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ