2020/2021
Цифровые методы в гуманитарных науках, часть 1
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Майнор
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
3 модуль
Преподаватели:
Скоринкин Даниил Андреевич,
Фишер Франк
Язык:
русский
Кредиты:
3
Контактные часы:
26
Программа дисциплины
Аннотация
Курс «Введение в Digital Humanities 1» знакомит студентов с новыми исследовательскими подходами и задачами в филологии,истории, лингвистике, культурологии, опирающимися на применение методов компьютерной обработки текста. Эти методы включают в себя создание и анализ корпусов текстов, построение статистических моделей, работу с большими данными, формализацию параметров текста, стилометрию, сетевой анализ, создание машиночитаемой структурированной разметки. Упомянутые подходы широко используются в современных гуманитарных исследования. Задача курса состоит в том, чтобы показать студентам исследовательский потенциал этих методов и вооружить их практическими навыками работы с существующими инструментами компьютерных исследований в гуманитарной сфере.
Цель освоения дисциплины
- Познакомить студентов с цифровыми методами, применяющимися в современных гуманитарных исследованиях: частотным анализом текстов, корпусными методами, стилометрией, сетевым анализом; дать опыт практического применения этих методов в самостоятельных исследованиях.
Планируемые результаты обучения
- Знает историю становления и развития точных методов в гуманитарных областях
- Понимает границы применимости точных методов к гуманитарным объектам исследования
- Имеет представление о современных методах получения, обработки и анализа гуманитарных данных
- умеет осуществлять поиск в корпусе Google Books при помощи интерфейса google Ngram Viewer, в том числе с применением специальных операторов запроса
- Понимает, в чем состоит вызов "великого непрочитанного" (the great unread) и почему традиционные методы филологических исследований трудно масштабируемы
- умеет осуществлять поиск в лингвистических корпусах, в том числе с применением специальных операторов запроса, обращающихся к грамматической, семантической и метатекстовой разметке;
- может установить, включить и применить корпусный менеджер для исследования собственных корпусов текстов
- владеет основами частотного анализа лексики, имеет представление о законе Ципфа, абсолютных и относительных частотностях, мере TF-IDF
- умеет пользоваться инструментами стилеметрии, в частности, использовать программный пакет stylo
- понимает принципы работы современных методов количественной атрибуции авторства (метод Delta)
- может формализовать гуманитарные объекты исследования в виде математического графа
- умеет производить сетевой анализ, расчитывать сетевые метрики центральности, применять алгоритмы кластеризации графа
Содержание учебной дисциплины
- Новые методы в гуманитарных наукахГуманитарные науки и вызов цифровой эпохи. Анализ данных в литературоведении, лингвистике, исторической науке, культурологии, истории искусства и креативных индустрий. Цифровые издания, картографические проекты, количественное отображение культурных трендов, визуализация, сети и графы в гуманитарных науках.
- Компьютерные методы в филологииПроблема репрезентативности литературного канона. «Дальнее чтение» (Distant Reading) Франко Моретти как способ объективизации филологического исследования. Макроанализ М. Джокерса. Идея «масштабируемого чтения». Использование инструмента Google Ngram Viewer; ограничения этого инструмента
- Корпусные исследованияПонятие корпуса. Корпус текстов как исследовательский объект. Виды корпусов. Лингвистические корпусы, национальные корпусы. Параллельные, устные, мультимедийные корпусы. Разметка и метаинформация в корпусе. Запросы к корпусу. Типология корпусных исследований. Корпусные исследования прозы: на какую помощь со стороны цифрового знания рассчитывают литературоведы? Что можно посчитать в романе? Корпусные исследования поэзии. Семантический ореол метра.
- СтилометрияИстория формальных исследований авторского стиля. Проблема спорного авторства и количественные подходы к её решению. Спорное авторство произведений Шекспира, Шолохова, «Записок федералиста» и д.р. Пример раскрытия авторства Дж. Роулинг. Понятие идиостиля автора. Программный пакет stylo для определения авторства. Стилометрия для исследований жанровых различий и стилохронографии.
- Теория сетей (графов) и её применения в гуманитарных науках.Математический граф и его основные элементы (ребра, вершины). Применение теории графов в анализе социальных сетей. История становления сетевого анализа в гуманитарных областях. Гарвардский прорыв 1960-х. Социологические, исторические, культурологические исследования с использованием теории графов. Применение сетевого анализа в литературоведении. Значимые количественные (математические) параметры графа. Плотность и диаметр графа. Основные свойства ребер и вершин. Степень вершины. Метрики центральности (betweenness centrality, closeness centrality, eigenvector centrality). Программа для анализа и визуализации графов Gephi. Основные возможности Gephi: импорт графа, алгоритмы укладки на плоскости, подсчет метрик и статистики, кластеризация графа с использованием Лувенского алгоритма.
Промежуточная аттестация
- Промежуточная аттестация (3 модуль)0.5 * защита проекта 1 (корпусные методы и столометрия) + 0.5 * Защита проекта 2 (сетевой анализ)
Список литературы
Рекомендуемая основная литература
- Hoover, D. L., O’Halloran, K., & Culpeper, J. (2014). Digital Literary Studies : Corpus Approaches to Poetry, Prose, and Drama. New York: Routledge. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=697081
- Moretti, F. (2013). Distant Reading. London [England]: Verso. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=729748
- Network theory, plot analysis. (2011). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.629DE0C9
- Newman, M. E. J. (2010). Networks : An Introduction. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=458550
- Schreibman, S., Siemens, R. G., & Unsworth, J. (2004). A Companion to Digital Humanities. Malden, MA: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=231516
Рекомендуемая дополнительная литература
- François Dominic Laramée. (2018). Introduction to stylometry with Python. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.4A7FD5D1
- Ramsay, S. (2011). Reading Machines : Toward and Algorithmic Criticism. Urbana: University of Illinois Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=569551
- Schöch, C., & Eder, M. (2018). Distant Reading for European Literary History, a COST Action. https://doi.org/10.5281/zenodo.1297690
- Underwood, T. (2016). Distant Reading and Recent Intellectual History. Germany, Europe: Humanities Commons. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.C1B34BEF