• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2020/2021

Цифровые методы в гуманитарных науках, часть 1

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус: Майнор
Когда читается: 3 модуль
Преподаватели: Скоринкин Даниил Андреевич, Фишер Франк
Язык: русский
Кредиты: 3
Контактные часы: 26

Программа дисциплины

Аннотация

Курс «Введение в Digital Humanities 1» знакомит студентов с новыми исследовательскими подходами и задачами в филологии,истории, лингвистике, культурологии, опирающимися на применение методов компьютерной обработки текста. Эти методы включают в себя создание и анализ корпусов текстов, построение статистических моделей, работу с большими данными, формализацию параметров текста, стилометрию, сетевой анализ, создание машиночитаемой структурированной разметки. Упомянутые подходы широко используются в современных гуманитарных исследования. Задача курса состоит в том, чтобы показать студентам исследовательский потенциал этих методов и вооружить их практическими навыками работы с существующими инструментами компьютерных исследований в гуманитарной сфере.
Цель освоения дисциплины

Цель освоения дисциплины

  • Познакомить студентов с цифровыми методами, применяющимися в современных гуманитарных исследованиях: частотным анализом текстов, корпусными методами, стилометрией, сетевым анализом; дать опыт практического применения этих методов в самостоятельных исследованиях.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает историю становления и развития точных методов в гуманитарных областях
  • Понимает границы применимости точных методов к гуманитарным объектам исследования
  • Имеет представление о современных методах получения, обработки и анализа гуманитарных данных
  • умеет осуществлять поиск в корпусе Google Books при помощи интерфейса google Ngram Viewer, в том числе с применением специальных операторов запроса
  • Понимает, в чем состоит вызов "великого непрочитанного" (the great unread) и почему традиционные методы филологических исследований трудно масштабируемы
  • умеет осуществлять поиск в лингвистических корпусах, в том числе с применением специальных операторов запроса, обращающихся к грамматической, семантической и метатекстовой разметке;
  • может установить, включить и применить корпусный менеджер для исследования собственных корпусов текстов
  • владеет основами частотного анализа лексики, имеет представление о законе Ципфа, абсолютных и относительных частотностях, мере TF-IDF
  • умеет пользоваться инструментами стилеметрии, в частности, использовать программный пакет stylo
  • понимает принципы работы современных методов количественной атрибуции авторства (метод Delta)
  • может формализовать гуманитарные объекты исследования в виде математического графа
  • умеет производить сетевой анализ, расчитывать сетевые метрики центральности, применять алгоритмы кластеризации графа
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Новые методы в гуманитарных науках
    Гуманитарные науки и вызов цифровой эпохи. Анализ данных в литературоведении, лингвистике, исторической науке, культурологии, истории искусства и креативных индустрий. Цифровые издания, картографические проекты, количественное отображение культурных трендов, визуализация, сети и графы в гуманитарных науках.
  • Компьютерные методы в филологии
    Проблема репрезентативности литературного канона. «Дальнее чтение» (Distant Reading) Франко Моретти как способ объективизации филологического исследования. Макроанализ М. Джокерса. Идея «масштабируемого чтения». Использование инструмента Google Ngram Viewer; ограничения этого инструмента
  • Корпусные исследования
    Понятие корпуса. Корпус текстов как исследовательский объект. Виды корпусов. Лингвистические корпусы, национальные корпусы. Параллельные, устные, мультимедийные корпусы. Разметка и метаинформация в корпусе. Запросы к корпусу. Типология корпусных исследований. Корпусные исследования прозы: на какую помощь со стороны цифрового знания рассчитывают литературоведы? Что можно посчитать в романе? Корпусные исследования поэзии. Семантический ореол метра.
  • Стилометрия
    История формальных исследований авторского стиля. Проблема спорного авторства и количественные подходы к её решению. Спорное авторство произведений Шекспира, Шолохова, «Записок федералиста» и д.р. Пример раскрытия авторства Дж. Роулинг. Понятие идиостиля автора. Программный пакет stylo для определения авторства. Стилометрия для исследований жанровых различий и стилохронографии.
  • Теория сетей (графов) и её применения в гуманитарных науках.
    Математический граф и его основные элементы (ребра, вершины). Применение теории графов в анализе социальных сетей. История становления сетевого анализа в гуманитарных областях. Гарвардский прорыв 1960-х. Социологические, исторические, культурологические исследования с использованием теории графов. Применение сетевого анализа в литературоведении. Значимые количественные (математические) параметры графа. Плотность и диаметр графа. Основные свойства ребер и вершин. Степень вершины. Метрики центральности (betweenness centrality, closeness centrality, eigenvector centrality). Программа для анализа и визуализации графов Gephi. Основные возможности Gephi: импорт графа, алгоритмы укладки на плоскости, подсчет метрик и статистики, кластеризация графа с использованием Лувенского алгоритма.
Элементы контроля

Элементы контроля

  • неблокирующий защита проекта 1 (корпусные методы и столометрия)
  • неблокирующий Защита проекта 2 (сетевой анализ)
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (3 модуль)
    0.5 * защита проекта 1 (корпусные методы и столометрия) + 0.5 * Защита проекта 2 (сетевой анализ)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hoover, D. L., O’Halloran, K., & Culpeper, J. (2014). Digital Literary Studies : Corpus Approaches to Poetry, Prose, and Drama. New York: Routledge. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=697081
  • Moretti, F. (2013). Distant Reading. London [England]: Verso. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=729748
  • Network theory, plot analysis. (2011). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.629DE0C9
  • Newman, M. E. J. (2010). Networks : An Introduction. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=458550
  • Schreibman, S., Siemens, R. G., & Unsworth, J. (2004). A Companion to Digital Humanities. Malden, MA: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=231516

Рекомендуемая дополнительная литература

  • François Dominic Laramée. (2018). Introduction to stylometry with Python. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.4A7FD5D1
  • Ramsay, S. (2011). Reading Machines : Toward and Algorithmic Criticism. Urbana: University of Illinois Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=569551
  • Schöch, C., & Eder, M. (2018). Distant Reading for European Literary History, a COST Action. https://doi.org/10.5281/zenodo.1297690
  • Underwood, T. (2016). Distant Reading and Recent Intellectual History. Germany, Europe: Humanities Commons. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.C1B34BEF