• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов

Публикации:

Полный список публикаций доступен по ссылке.

Киселев В.С., Кропотов Д.А., Пронина Н.М. Сиамская сеть, машинная атрибуция почерка и неизвестный Жуковский // Имагология и компаративистика. 2024. № 22. C. 156-179.

Lomov N., Kropotov D., Stepochkin D., Laptev A. Handwritten Text Recognition and Browsing in Archive of Prisoners' Letters from Smolensk Convict Prison // Lecture Notes in Computer Science (LNCS). 2025

Болтунова Е.М., Лаптев А.К., Ломов Н.А. Каторга и рождение новой политической риторики: анализ корпуса писем политических заключенных начала ХХ века // Имагология и компаративистика. 2023. № 20. С. 294–314.

Киселев В.С. Письма неустановленных лиц к В.А. Жуковскому: возможности машинного анализа и атрибуции рукописных документов // Имагология и компаративистика. 2023. № 20. С. 232–246.

Пенская Е.Н. "Дым и чад черновиков". Подходы к тематическому моделированию рукописных источников А. В. Сухово-Кобылина и родственных семейных кланов в российских архивах // Имагология и компаративистика. 2023. № 19. С. 213-233. 

Киселев В.С., Лебедева О.Б., Третьяков Е.О. Проблемы графической, синтаксической и семантической классификации рукописных документов рубежа XVIII–XIX вв. из российских архивов: возможности машинного анализа данных (на материале коллективных писем к В. А. Жуковскому) // Имагология и компаративистика. 2023. № 19. С. 165-187. 

Болтунова Е.М. Региональная история России: исследовательское поле и архивная практика (1990-е — начало 2020-х годов) // Новое литературное обозрение. 2022. № 6(178). С. 235-250.

Проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов» (№22-68-00066) выполняется при поддержке Российского научного фонда.

В рамках настоящего проекта предлагается разработать систему автоматизированной навигации по рукописному тексту, предоставляющей пользователю данные о тематике, составе и структуре нерасшифрованной рукописи, а также осуществляющей моделирование корпуса рукописных текстов по запросу исследователя. В отличие от наиболее популярных подходов (распознавание всех символов текста, не реализуемое в настоящее время программным обеспечением любого класса), новая методика интеллектуального анализа данных сосредоточена на исследовании графических элементов.

Ряд задач исследования будет решен методами гуманитарных наук (графическая, синтаксическая и семантическая классификация текста), ряд – методами интеллектуального анализа данных (распознавание образов, навигация, кластеризация, анализ связей между компонентами текста). В качестве объектов изучения будет использован корпус высококачественных цифровых копий историко-литературных документов времени расцвета русской письменной культуры конца XVIII – середины XX вв., имеющих четко выраженную иерархическую и графическую организацию: письма, дневниковые записи, мемуары, записные книжки и рабочие тетради, оригиналы которых находятся в архивах России.

Новости

В журнале "Имагология и компаративистика" (№ 22 за 2024 г.) опубликована статья В.С. Киселева и Д.А. Кропотова "Сиамская сеть, машинная атрибуция почерка и неизвестный Жуковский" (в соавторстве с Н.М. Прониной). Материал подготовлен в рамках совместной работы филологов и математиков.
16 декабря, 2024 г.
На портале "Регионы России в исторической перспективе" опубликована статья А.К. Лаптева "Декодируя рукопись: перспективы использования искусственного интеллекта в рамках автоматизации работы с архивными историческими источниками".
12 декабря, 2024 г.
С 17 по 20 октября прошла XII международная конференция "Analysis of Images, Social Networks and Texts" (AIST). В рамках конференции участники проекта Н. Ломов и Д. Кропотов представили доклад "YOLO-HTR: Page-Level Recognition of Historical Handwritten Document Collections".
8 декабря, 2024 г.
В журнале “Programming and Computer Software” (Т. 50(4) за 2024 г.) опубликована статья Л.М. Местецкого "Constructing the Internal Voronoi Diagram of Polygonal Figure Using the Sweepline Method”.
3 декабря, 2024 г.
28 ноября 2024 г. состоялся круглый стол "Digitalia Humaniora: память о будущем" в рамках научного форума "Гуманитарные науки в XXI веке: между текстом и цифрой", посвященный 10-летию Факультета гуманитарных наук НИУ ВШЭ. В работе круглого стола принял участие научный сотрудник Института Антон Лаптев с докладом на тему "Большие языковые модели и метаданные в процессе обработки естественного языка".
2 декабря, 2024 г.
17-18 октября 2024 г. в Перми состоялась IX Всероссийская научно-практическая конференция с международным участием "Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века" на базе Пермского государственного национального исследовательского университета и Национального исследовательского университета "Высшая школа экономики" в Перми. Научный сотрудник Института Антон Лаптев выступил с докладом на тему "Интеллектуальный анализ дневника Ф.П. Литке: большие языковые модели и метаданные в процессе обработки естественного языка".
31 октября, 2024 г.
Завершена работа по распознаванию текста дневника адмирала, основателя Императорского российского географического общества Ф.П. Литке из фондов Государственного архива Российской Федерации методами искусственного интеллекта с использованием комбинации математических методов (методика восстановления траектории пера автора и нейронные сети).
20 октября, 2024 г.
С 18 по 20 сентября на базе Национального исследовательского Томского государственного университета прошли Вторые Международные научные чтения памяти Александра Сергеевича Янушкевича, приуроченные к 80-летию со дня его рождения. В конференции приняла участие Елена Пенская, выступив с докладом "Римский травелог архимандрита Палладия в письмах 1860-х годов художнице Софье Сухово-Кобылиной".
28 сентября, 2024 г.
В 149 томе журнале "Slavic Literatures" (ранее – "Russian Literature") опубликована новая статья Елены Пенской "«Литература в кавычках». Наследие Козьмы Пруткова и акционизм XX века" ("«Literature in Quotation Marks». Kozma Prutkov’s Legacy and 20th Century Actionism").
28 августа, 2024 г.
Еще новости