• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Студенты второго курса программы опробовали цифровые методы в историческом исследовании

Студенты 2015 года набора опробовали на себе совершенно новый блок курсов — миноры факультета гуманитарных наук. Это курсы гуманитарного направления, в которых задействуются методы истории, лингвистики, философии, культурологии. Из всех возможных вариантов второкурсники Софья Шкляева, Михаил Щегольков и Кристина Покровская выбрали цифровые технологии и чтобы разобраться, чем они могут помочь гуманитарию на примере проверки авторства мемуаров Л. И. Брежнева. 

Часто высказывается мнение, что за генерального секретаря их написали другие люди, профессиональные литераторы. На эту роль предлагаются А. А. Аграновский, А. П. Мурзин и А. Я. Сахнин. Однако точно не известно, кто именно писал каждую книгу. Поскольку работа у нас предполагалась учебная и небольшая, мы взяли для исследования те произведения, которые уже оцифрованы. Это восемь частей мемуаров Брежнева, три книги Сахнина и одна книга Аграновского. Также у нас возникла идея использовать — в качестве «контрольной группы» — две книги другого писателя-соцреалиста, В. А. Кочетова.

Метод, который мы выбрали для нашего исследования, называется стилеметрия (стилометрия) или stylometry. Он появился достаточно давно и основывался на сравнении стилистических особенностей текста. Главной целью метода является выявление авторства текста, но возможно также датировки, определение жанра, отслеживание изменения стиля, обозначение гендерных особенностей текста.  В эпоху компьютерных технологий стилеметрия получила развитие благодаря появлению множества платформ и программ. Так, мы в своем исследовании использовали пакет stylo для R (свободная программная среда). Принцип работы stylo, если не вдаваться в сложные математические алгоритмы (с которыми у гуманитариев есть некоторые трудности) следующий: программа делит весь текст на слова, выявляет частотные и сохраняет частотность для каждого слова. Таким образом,  создается некоторый показатель, который потом и сравнивается между выбранными текстами. Удобство именно этого пакета в том, что R предоставляет множество способов для визуализации полученных результатов и не требует углубленных навыков программирования.

После закачивания всех текстов и использования пакета stylo, мы получили схему, в которой произведения под авторством Брежнева уже в самом начале отделяются от всех остальных. Это не даёт нам окончательных выводов. Но, возможно, мемуары Брежнева писались им самим, или же коллективом авторов при его участии.


Пример отчета из системы Stylo
 

Исследование можно в дальнейшем развить. Так, доступны произведения Мурзина, Сахнина и Аграновского, пока не переведённые в цифровой формат. Помимо этого, изданы дневниковые записи Брежнева – конечно, здесь перед нами уже другой жанр, и стилеметрию надо применять с большой осторожностью, так как компьютеру пока сложно учитывать все нюансы орфографии. Но, в любом случае, мы смогли лучше понять, как работать с важным инструментом digital humanities, при этом коснувшись одной из загадок советской литературы.

Покровская Кристина, Шкляева Софья, Щегольков Михаил БИС 151