• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов

Публикации:

Болтунова Е.М., Лаптев А.К., Ломов Н.А. Каторга и рождение новой политической риторики: анализ корпуса писем политических заключенных начала ХХ века // Имагология и компаративистика. 2023. № 20. С. 294–314.

Киселев В.С. Письма неустановленных лиц к В.А. Жуковскому: возможности машинного анализа и атрибуции рукописных документов // Имагология и компаративистика. 2023. № 20. С. 232–246.

Пенская Е.Н. "Дым и чад черновиков". Подходы к тематическому моделированию рукописных источников А. В. Сухово-Кобылина и родственных семейных кланов в российских архивах // Имагология и компаративистика. 2023. № 19. С. 213-233. 

Киселев В.С., Лебедева О.Б., Третьяков Е.О. Проблемы графической, синтаксической и семантической классификации рукописных документов рубежа XVIII–XIX вв. из российских архивов: возможности машинного анализа данных (на материале коллективных писем к В. А. Жуковскому) // Имагология и компаративистика. 2023. № 19. С. 165-187. 

Болтунова Е.М. Региональная история России: исследовательское поле и архивная практика (1990-е — начало 2020-х годов) // Новое литературное обозрение. 2022. № 6(178). С. 235-250.

Полный список публикаций доступен по ссылке.

Проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов» (№22-68-00066) выполняется при поддержке Российского научного фонда.

В рамках настоящего проекта предлагается разработать систему автоматизированной навигации по рукописному тексту, предоставляющей пользователю данные о тематике, составе и структуре нерасшифрованной рукописи, а также осуществляющей моделирование корпуса рукописных текстов по запросу исследователя. В отличие от наиболее популярных подходов (распознавание всех символов текста, не реализуемое в настоящее время программным обеспечением любого класса), новая методика интеллектуального анализа данных сосредоточена на исследовании графических элементов.

Ряд задач исследования будет решен методами гуманитарных наук (графическая, синтаксическая и семантическая классификация текста), ряд – методами интеллектуального анализа данных (распознавание образов, навигация, кластеризация, анализ связей между компонентами текста). В качестве объектов изучения будет использован корпус высококачественных цифровых копий историко-литературных документов времени расцвета русской письменной культуры конца XVIII – середины XX вв., имеющих четко выраженную иерархическую и графическую организацию: письма, дневниковые записи, мемуары, записные книжки и рабочие тетради, оригиналы которых находятся в архивах России.

Новости

15–16 апреля 2024 г. в Новосибирском государственном педагогическом университете состоялась Всероссийская научная конференция "Шестые Чумаковские чтения. Текст и претекст". Конференция была посвящена памяти доктора филологических наук, профессора, известного пушкиноведа Юрия Николаевича Чумакова.
22 апреля
8 апреля состоялся рабочий семинар участников проекта, посвящённый кейсу по расшифровке дневников адмирала Федора Петровича Литке.
15 апреля
Исследовательский коллектив закончил подготовку первого рабочего прототипа программы для просмотра и работы с расшифрованными рукописями дневника адмирала Федора Петровича Литке.
15 апреля
В 2024 году к научному коллективу проекта присоединился новый стажёр - Мария Долгова. В рамках работы проекта Мария войдёт в состав группы, занимающейся отбором и анализом мемуарно-дневникового корпуса XIX - середины XX вв. 
11 апреля
В специальном блоке журнала "Имагология и компаративистика" (№20), посвященном возможностям машинного анализа и атрибуции рукописных документов, опубликованы статьи Екатерины Болтуновой, Антона Лаптева, Никиты Ломова и Виталия Киселева (в соавторстве).
11 декабря, 2023 г.
При решении задач по расшифровке корпуса рукописных источников коллектив проекта "Культурное наследие" осуществил первичную расшифровку одного из томов личного дневника адмирала Федора Петровича Литке.
7 декабря, 2023 г.
Члены научного коллектива, представляющие группу математиков, планируют провести серию выступлений в рамках 21-й Всероссийской конференции с международным участием "Математические методы распознавания образов". Конференция организована Российской академией наук, Федеральным исследовательским центром "Информатика и управление" РАН и Национальным комитетом при Президиуме РАН по распознаванию образов и анализу изображений и состоится 12-15 декабря 2023 г. на площадке Федерального исследовательского центра "Информатика и управление" РАН.
5 декабря, 2023 г.
Статья Л.М. Местецкого и Н.М. Пронина "Классификация штрихов рукописного текста на основе расстояния Фреше" опубликована в сборнике трудов "GraphiCon 2023: труды 33-й Международной конференции по компьютерной графике и машинному зрению".
21 ноября, 2023 г.
В рамках реализации задачи по автоматической расшифровке и интеллектуальному анализу рукописей сотрудники Института региональных исторических исследований обратились к оригинальному историческому источнику - дневнику адмирала Федора Петровича Литке. Особенностью данного исторического источника, помимо отсутствия на настоящее момент его полной ручной расшифровки, выступает сложная структура почерка автора, а также большое количество специальной терминологии и иностранных слов (морские термины, картографические понятия, вставки на нескольких иностранных языках и т.д.). 
8 ноября, 2023 г.
В рамках курса "Digital Humanities: Level A1", разработанного Факультетом гуманитарных наук по запросу команды проекта "Data Culture", Екатерина Болтунова и Антон Лаптев представили доклад, посвященный использованию нейронных сетей для расшифровки и интеллектуального анализа рукописных исторических источников. 
8 ноября, 2023 г.
Еще новости