Бакалавриат
2025/2026





Цифровые методы для гуманитариев
Статус:
Курс обязательный (Филология)
Кто читает:
Департамент филологии
Где читается:
Санкт-Петербургская школа гуманитарных наук и искусств
Когда читается:
3-й курс, 1, 2 модуль
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
62
Программа дисциплины
Аннотация
Курс представляет собой введение в цифровые гуманитарные науки для лингвистов и литературоведов и знакомит слушателей с наиболее выдающимися проектами и направлениями в digital humanities. Студенты изучат основные категории и инструменты для разметки текстовых данных и описания культурных объектов; освоят методы стилеметрического анализа и сетевой визуализации данных в социогуманитарных науках; познакомятся с ключевыми понятиями и методами корпусной лингвистики. Курс способствует выработке и закреплению профессиональных навыков самостоятельной исследовательской работы с использованием цифровых методов в междисциплинарной перспективе.
Цель освоения дисциплины
- Получение студентами знания об основных методах и направлениях развития цифровых гуманитарных наук (digital humanities) и применения цифровых технологий для решения практических задач, связанных с сохранением культурного наследия;
- Ознакомление студентов-филологов с базовыми понятиями и методами анализа и визуализации филологических данных, развитие навыков работы с программным инструментарием для визуализации графов и сетевого анализа, стилеметрического анализа и решения задач автоматической обработки текстов;
- Подготовка студентов к самостоятельной исследовательской деятельности в области цифровых гуманитарных наук, включая развитие навыков работы с существующими цифровыми ресурсами и создания собственных цифровых проектов;
- Ознакомление студентов-филологов с основными понятиями и возможностями корпусной лингвистики;
- Формирование практических навыков работы с наиболее известными мировыми лингвистическими ресурсами и их использования для решения конкретных исследовательских задач;
- Освоение на практике технологически несложных методов корпусной и компьютерной лингвистики, а также приобретение опыта работы с инструментами для автоматизированного создания и аннотирования своего собственного исследовательского корпуса;
- Ознакомление студентов-филологов с методами искусственного интеллекта и возможностями их применения для решения общих и специальных задач в лингвистической и литературоведческой деятельности.
Планируемые результаты обучения
- Уметь описывать и применять основные принципы подготовки и разметки данных при подготовке корпуса, включая адаптацию разметки под исследовательские задачи с использованием стандарта TEI.
- Знать историю возникновения проекта TEI (Text Encoding Initiative) и примеры ресурсов использующих его принципы в своей работе.
- Знать основные международные и отечественные исследовательские инфраструктуры в области Digital Humanities.
- Уметь пользоваться инструментами для проведения стилеметрического анализа, в частности программным пакетом 'stylo' (на языке программирования R).
- Уметь проводить сетевой анализ художественных текстов, рассчитывать метрики центральности, применять алгоритмы выделения сообществ в социальных графах с помощью Gephi.
- Владеть навыками работы с цифровыми ресурсами и их использования для проведения научных исследований междисциплинарного характера.
- Уметь объяснять принципы использования корпусов текстов в доступной форме.
- Уметь использовать в своей работе источники и программный продукт на иностранном языке.
- Уметь работать с корпусами текстов и базами данных, эффективно искать нужную информацию и источник.
- Уметь формулировать задачи корпусного исследования, составлять соответствующие корпусные запросы или применять необходимые программы, обрабатывать полученные данные.
- Знать возможности использования корпусной лингвистики в других областях знаний.
Содержание учебной дисциплины
- Введение в Digital Humanities
- Цифровые ресурсы в гуманитарных науках: от архивов до семантических изданий
- Стилеметрический анализ
- Сетевой анализ в гуманитарных исследованиях
- Введение в корпусную лингвистику
- Классификация лингвистических корпусов
- Принципы и способы составления корпусов. Лингвистическое аннотирование
- Постановка задачи корпусного исследования. Практика по работе в наиболее известных корпусах
- Качественные и количественные данные в корпусе. Основы статистики
- Корпусные методы в применении к различным дисциплинам
Элементы контроля
- Практические работыМножественное задание: состоит из 2 оцениваемых кейсов. Совмещённый элемент контроля. Включает: 1. Кейс по работе с ПО "Gephi" для сетевого анализа и визуализации. 2. Кейс по работе с функциями stylo, classify и oppose пакета для стилеметрического анализа ‘stylo’. При выполнении задания запрещено использование генеративных моделей ИИ. При нарушении использования ИИ за задание выставляется оценка 0.
- РазметкаРазметка художественного прозаического текста в соответствии с конвенциями, принятыми в рамках стандарта представления данных TEI.
- ДокладДоклад предполагает развитие дискуссии на тему "Новая культура или утопия? Цифровые филологические ресурсы, энциклопедии и семантические издания". Выполняется в группах по 4-5 чел. и предполагает презентацию результатов работы с одним цифровым ресурсом (на выбор), его описание по предложенному преподавателем плану, а также представление опыта проведения мини-исследования на его основе. Представляется очно и сопровождается презентацией, содержащей наглядный графический (таблицы, схемы) или иной материал, иллюстрирующий результаты работы с ресурсом
- Домашние заданияМножественное задание: состоит из 3 практических заданий. Асинхронный элемент контроля. Предполагает отработку навыков, полученных на семинарах. Включает: 1. Работу с экспортированными данными из НКРЯ. 2. Лингвистическое аннотирование мультимедийных данных в системе типа ELAN. 3. Веб-скрейпинг, разведочный анализ и автоматическое аннотирование текстовых данных с помощью специальных лингвистических модулей пакета NLTK на языке программирования Python.
- ЭкзаменЭкзамен (контрольная работа) проводится на последнем семинаре и предполагает выполнение теоретических и практических заданий на компьютерах в SmartLMS по второй части курса (2 модуль). При выполнении задания можно пользоваться бумажным черновиком, но записи в черновике не учитываются при оценивании работы. Можно пользоваться только теми ресурсами Сети, которые указаны в заданиях.
- Самостоятельные работыМножественное задание: состоит из 2 тестов. Самостоятельные работы выполняются на компьютерах в аудитории в формате теста, представленного в нескольких вариантах. Студент работает самостоятельно, в дальнейшем возможно обсуждение возникших вопросов. Предусмотрено ограничение по времени.
Промежуточная аттестация
- 2025/2026 2nd moduleИтоговая (результирующая) оценка рассчитывается по формуле: Орез = 0.5 * О_1модуль + 0.5 * О_2модуль, где О_1модуль - оценка за 1-й модуль, О_2модуль - оценка за 2-й модуль. Расчет оценок за 1-й модуль и 2-й модуль осуществляется по следующим формулам: О_1модуль = 0.4 * Практические работы + 0.3 * Разметка + 0.3 * Доклад О_2модуль = 0.3 * Самостоятельные работы + 0.4 * Домашние работы + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Schreibman, S., & Siemens, R. G. (2013). A Companion to Digital Literary Studies (Vol. Pbk. ed). Chichester, West Sussex: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=565506
- Захаров, В. П. Корпусная лингвистика : учебник / В. П. Захаров, С. Ю. Богданова. - 3-е изд., перераб. - Санкт-Петербург : СПбГУ, 2020. - 234 с. - ISBN 978-5-288-05997-1. - Текст : электронный. - URL: https://znanium.com/catalog/product/1244746
Рекомендуемая дополнительная литература
- 21218 - Языкознание: От Аристотеля до компьютерной лингвистики - В.Алпатов; И. Робот - Альпина нон-фикшн - 9789152127353 - 2020 - https://hse.alpinadigital.ru/audio/21218 - Alpina
- Baker, P. (2009). Contemporary Corpus Linguistics. London: Continuum. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=344364
- Baker, P., Hardie, A., & McEnery, T. (2006). A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=169612
- Hoover, D. L., O’Halloran, K., & Culpeper, J. (2014). Digital Literary Studies : Corpus Approaches to Poetry, Prose, and Drama. New York: Routledge. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=697081
- Володин, А. (2014). Digital Humanities (Цифровые Гуманитарные Науки): В Поисках Самоопределения. Вестник Пермского Университета. Серия: История, (3 (26)). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsclk&AN=edsclk.15671143
- Шерстинова, Т. (2008). «Один речевой день» на временной шкале: о перспективах исследования динамических процессов на материале звукового корпуса. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.2CBC2459