Бакалавриат
2025/2026



Введение в количественный анализ текста
Статус:
Курс обязательный (Филология)
Кто читает:
Департамент филологии
Где читается:
Санкт-Петербургская школа гуманитарных наук и искусств
Когда читается:
2-й курс, 1 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Шерстинова Татьяна Юрьевна
Язык:
русский
Кредиты:
3
Контактные часы:
24
Программа дисциплины
Аннотация
Курс посвящен изучению количественных методов анализа текстов различных типов (литературных, научных, публицистических, медиатекстов, разговорной речи и др.), базирующихся на использовании компьютерных программ обработки текста. Рассматриваются подходы к автоматическому и квантитативному (статистическому) анализу текста, задачи и методы стилеметрии, методы анализа лексических особенностей текстов, построение частотных словарей, автоматический анализ динамики текста, изучаются компьютерные программы, позволяющие производить автоматический анализ текстов.
Цель освоения дисциплины
- Ознакомление студентов с основными понятиями и подходами к количественному анализу текста
- Знакомство студентов с методами компьютерного анализа текста на материале прозаических и поэтических текстов XIX-XX веков
Планируемые результаты обучения
- Различать основные направления автоматического анализа художественного текста.
- Анализировать лексические особенности текста, разрабатывает частотный словарь и конкорданс.
- Использовать основные методы стилеметрии.
- Использовать методы автоматического анализа структуры текста.
- Рассматривать текст с точки зрения его системных характеристик, выражающихся в количественных мерах
Содержание учебной дисциплины
- Возможности компьютерного анализа текста
- Лексические особенности текста. Частотные словари.
- Подходы и методы стилеметрии
- Методы автоматического анализа структуры и динамики текста.
Элементы контроля
- Практическая работа №2Цель работы — оценить навыки студентов в использовании корпусного менеджера AntConc. Выполняется письменно в компьютерном классе. Время выполнения – 20 минут.
- Контрольная работаКонтрольная экзаменационная работа выполняется письменно, внеаудиторно, на компьютере, с использованием программ обработки текстовых данных. Работа выполняется студентами на разных текстах, при сдаче идентичных работ разными студентами, все такие работы оцениваются как 0. Плагиат оценивается как 0.
- Практическая работа №1Выполняется письменно в компьютерном классе. Работа с литературным корпусом CLIC Dickens - (открытый ресурс) (если специально не оговорено, определяем для всего текста/subsets). Время выполнения – 20 минут.