• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов

Публикации:

Полный список публикаций доступен по ссылке.

Киселев В.С., Кропотов Д.А., Пронина Н.М. Сиамская сеть, машинная атрибуция почерка и неизвестный Жуковский // Имагология и компаративистика. 2024. № 22. C. 156-179.

Lomov N., Kropotov D., Stepochkin D., Laptev A. Handwritten Text Recognition and Browsing in Archive of Prisoners' Letters from Smolensk Convict Prison // Lecture Notes in Computer Science (LNCS). 2025

Болтунова Е.М., Лаптев А.К., Ломов Н.А. Каторга и рождение новой политической риторики: анализ корпуса писем политических заключенных начала ХХ века // Имагология и компаративистика. 2023. № 20. С. 294–314.

Киселев В.С. Письма неустановленных лиц к В.А. Жуковскому: возможности машинного анализа и атрибуции рукописных документов // Имагология и компаративистика. 2023. № 20. С. 232–246.

Пенская Е.Н. "Дым и чад черновиков". Подходы к тематическому моделированию рукописных источников А. В. Сухово-Кобылина и родственных семейных кланов в российских архивах // Имагология и компаративистика. 2023. № 19. С. 213-233. 

Киселев В.С., Лебедева О.Б., Третьяков Е.О. Проблемы графической, синтаксической и семантической классификации рукописных документов рубежа XVIII–XIX вв. из российских архивов: возможности машинного анализа данных (на материале коллективных писем к В. А. Жуковскому) // Имагология и компаративистика. 2023. № 19. С. 165-187. 

Болтунова Е.М. Региональная история России: исследовательское поле и архивная практика (1990-е — начало 2020-х годов) // Новое литературное обозрение. 2022. № 6(178). С. 235-250.

Проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов» (№22-68-00066) выполняется при поддержке Российского научного фонда.

В рамках настоящего проекта предлагается разработать систему автоматизированной навигации по рукописному тексту, предоставляющей пользователю данные о тематике, составе и структуре нерасшифрованной рукописи, а также осуществляющей моделирование корпуса рукописных текстов по запросу исследователя. В отличие от наиболее популярных подходов (распознавание всех символов текста, не реализуемое в настоящее время программным обеспечением любого класса), новая методика интеллектуального анализа данных сосредоточена на исследовании графических элементов.

Ряд задач исследования будет решен методами гуманитарных наук (графическая, синтаксическая и семантическая классификация текста), ряд – методами интеллектуального анализа данных (распознавание образов, навигация, кластеризация, анализ связей между компонентами текста). В качестве объектов изучения будет использован корпус высококачественных цифровых копий историко-литературных документов времени расцвета русской письменной культуры конца XVIII – середины XX вв., имеющих четко выраженную иерархическую и графическую организацию: письма, дневниковые записи, мемуары, записные книжки и рабочие тетради, оригиналы которых находятся в архивах России.

Новости

19 августа 2025 года на сайте издательского дома "Коммерсантъ" вышла новая беседа под названием "Методы и научные задачи распознавания рукописей". Гостями программы стали Леонид Местецкий – профессор, доктор технических наук ВМК МГУ, НИУ ВШЭ, и Елена Пенская – профессор, доктор филологических наук НИУ ВШЭ, МФТИ.
9 сентября
18 июня Антон Лаптев провел для магистрантов направления "цифровая гуманитаристика" лекцию по теме "Реставрация изображений исторических документов, рукописных текстов"
30 июня
В 23-м номере научного журнала "Имагология и компаративистика" за 2025 год опубликована рецензия Елены Пенской на коллективную монографию "Artificial Intelligence, Archives and Manuscripts. New Relationships between the Virtual Archive and its Referent" (Edinburgh: University of Edinburgh, 2025. 584 p.).
19 июня
В 23-м номере научного журнала "Имагология и компаративистика" за 2025 год опубликована статья Екатерины Болтуновой и Антона Лаптева “Распознавание рукописного текста и интеллектуальный анализ: возможности нейронных технологий на примере работы с "Дневником" Ф. П. Литке”.
18 июня
10 апреля в рамках межвузовского круглого стола "Историк будущего: искусственный интеллект - новый поворот в исторической науке?", организованном Российским государственным гуманитарным университетом, выступил Антон Лаптев с докладом "Нейросетевые технологии и исторические источники: практические результаты анализа рукописи и исследовательские решения по получению метаданных на примере дневника Ф.П. Литке".
22 апреля
В рамках проекта "Культурное наследие" состоялась серия рабочих встреч, посвященных развитию проекта в 2025 году. Ключевым направлением предстоящей работы было определено создание единой программной среды (приложения), позволяющей исследователю комплексно взаимодействовать с рукописными историческими документами.
8 апреля
В журнале "Имагология и компаративистика" (№ 22 за 2024 г.) опубликована статья В.С. Киселева и Д.А. Кропотова "Сиамская сеть, машинная атрибуция почерка и неизвестный Жуковский" (в соавторстве с Н.М. Прониной). Материал подготовлен в рамках совместной работы филологов и математиков.
16 декабря, 2024 г.
На портале "Регионы России в исторической перспективе" опубликована статья А.К. Лаптева "Декодируя рукопись: перспективы использования искусственного интеллекта в рамках автоматизации работы с архивными историческими источниками".
12 декабря, 2024 г.
С 17 по 20 октября прошла XII международная конференция "Analysis of Images, Social Networks and Texts" (AIST). В рамках конференции участники проекта Н. Ломов и Д. Кропотов представили доклад "YOLO-HTR: Page-Level Recognition of Historical Handwritten Document Collections".
8 декабря, 2024 г.
Еще новости