• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов

Проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов» выполняется при поддержке Российского научного фонда.

В рамках настоящего проекта предлагается разработать систему автоматизированной навигации по рукописному тексту, предоставляющей пользователю данные о тематике, составе и структуре нерасшифрованной рукописи, а также осуществляющей моделирование корпуса рукописных текстов по запросу исследователя. В отличие от наиболее популярных подходов (распознавание всех символов текста, не реализуемое в настоящее время программным обеспечением любого класса), новая методика интеллектуального анализа данных сосредоточена на исследовании графических элементов.

Ряд задач исследования будет решен методами гуманитарных наук (графическая, синтаксическая и семантическая классификация текста), ряд – методами интеллектуального анализа данных (распознавание образов, навигация, кластеризация, анализ связей между компонентами текста). В качестве объектов изучения будет использован корпус высококачественных цифровых копий историко-литературных документов времени расцвета русской письменной культуры конца XVIII – середины XX вв., имеющих четко выраженную иерархическую и графическую организацию: письма, дневниковые записи, мемуары, записные книжки и рабочие тетради, оригиналы которых находятся в архивах России.

Сформированы тестовые задачи проекта

В результате работы по проекту в 2022 г. исследовательская группа сформировала три тестовые задачи, которые будут выполняться на основе нескольких сотен цифровых копий архивных документов.

Антон Лаптев на конференции «"Цифра" в социально-гуманитарных исследованиях: метод, поле, реальность?»

14-16 ноября научный сотрудник Лаборатории Антон Лаптев принял участие в конференции «"Цифра" в социально-гуманитарных исследованиях: метод, поле, реальность?», которая проводилась на базе Иркутского государственного университета.

Томский государственный университет стал партнером проекта "Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов"

В рамках договора о научно-исследовательских работах, которые заключили НИУ ВШЭ и Томский государственный университет, филологи из Томска присоединятся к проекту, поддержанному в рамках гранта РНФ. 

На портале HSE Daily опубликовано интервью с заведующей лабораторией Екатериной Болтуновой

Российский научный фонд поддержал проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов». Его задачей является разработка методики автоматизированного анализа информации, содержащейся в рукописях, минуя обработку источника вручную. HSE Daily побеседовало с руководителем проекта — заведующей Лабораторией региональной истории России факультета гуманитарных наук НИУ ВШЭ профессором Екатериной Болтуновой.

Еще новости