• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Цифровые гуманитарные науки

Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Курс обязательный (Цифровые методы в гуманитарных науках)
Направление: 45.04.03. Фундаментальная и прикладная лингвистика
Когда читается: 1-й курс, 1-4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Преподаватели: Орехов Борис Валерьевич, Поздняков Иван Сергеевич, Скоринкин Даниил Андреевич, Сорокин Семен Александрович
Прогр. обучения: Цифровые методы в гуманитарных науках
Язык: русский
Кредиты: 9
Контактные часы: 64

Программа дисциплины

Аннотация

Курс «Цифровые гуманитарные науки» читается на 1-ом курсе магистерской программы «Цифровые методы в гуманитарных науках» с 1-ого по 4-ый модуль. Для успешного освоения дисциплины студент должен быть уверенным пользователем ПК на уровне продвинутого пользователя, владеть английским в достаточной мере для чтения современных научных статей и монографий, а также не испытывать природного отвращения к статистике и количественным методам в гуманитарной науке. Знания, умения и навыки, полученные на курсе, в дальнейшем могут быть применены при написании КР и ВКР, участии в ПИС и в дальнейшей профессиональной деятельности.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель курса — познакомить студентов с новыми исследовательскими подходами и задачами в литературоведении, истории, культурологии, философии и других науках гуманитарного цикла, базирующимися на применении методов компьютерной обработки текста, анализа и визуализации данных в гуманитарных областях. Эти методы включают в себя создание и анализ корпусов текстов, построение статистических моделей, работу с большими данными, формализацию параметров текста, электронное картографирование и т.п. Указанные методы широко используются в современной гуманитарной науке. Задача курса состоит в том, чтобы показать потенциал цифровых методов в гуманитарных исследованиях и снабдить студентов практическими навыками их применения. Также часть курса будет посвящена различным методам цифрового сохранения и репрезентации культурных объектов в современной медиа-среде. Сюда относятся цифровая публикация культурно-значимых текстов, теория и практика электронных семантических изданий, аудиовизуальные технологии и дополненная реальность в музейном деле, основы 3D-моделирования.
Планируемые результаты обучения

Планируемые результаты обучения

  • Воспроизводить спектор взглядов современной академической среды на то, чем являются и являются Digital Humanities. Может сформулировать собственное определение и критерии разграничения дисциплин(ы).
  • Воспроизводить базовые методы корпусного поиска и корпусного анализа, получил опыт их практического применения на корпусах; Познакомился возможностями современных инструментов автоматической обработки текстов; Знаком(а) и критически осмыслил(а) идею «дальнего чтения» (Distant Reading) Франко Моретти
  • Применять принципы измерения метрики Delta и других аналогичных метрик стилеметрии; Умеет пользоваться инструментами стилеметрии, самостоятельно осуществлять стилеметрические анализ
  • Применять принципы работы алгоритмов тематического моделирования; Владеет инструментами теаматического моделирования, может осуществить тематическое моделирование корпуса текстов самостоятельно
  • Анализировать основные источники получения культурно-значимых текстов в цифровой форме; Знаком(а) с принципами построения современных цифровых изданий художественной литературы
  • Применять технологический процесс офицровки текста, знаком с принципами работы систем оптического распознавания (OCR), умеет использовать готовые инструменты для OCR
  • Применять работу с форматами XML, HTML, понимать их предназначение; Может создать корректный XML-документ, оценить его валидность относительно заданной XML-схемы
  • Воспроизводить типы научных моделей, применяемыми в цифровых гуманитарных исследованиях Владеет основами онтологического моделирования, может построить онтологию для определенной сферы гуманитарного знания.
  • Воспроизводить сведения о действующих на момент проведения курса открытых электронных базах знаний; обладает навыками поиска в таких базах, в т.ч. с использованием специального языка запросов SPARQL
  • Воспроизводить основные термины и понятия картографии и пространственного анализа, типы геоданных. Владеет простейшими средствами электронной георазметки (напр., geojson)
  • Воспроизводить основы теории графов и применения сетевого анализа; осознает математический смысл сетевых метрик центральности, принципов кластеризации графа Владеет программными инструментами и библиотеками для сетевого анализа, может выполнять его самостоятельно
  • Воспроизводить основные технологии, применяемые в сфере культуры, в учреждениях культуры, в музеях.
  • Воспроизводить информацию о типах цифровых изображений (растровые, векторные) и их устройстве. Понимает принципы работы алгоритмов компьютерного зрения, применяемых для массового анализа цифровых изображений. Может сформулировать общую идею «культурной аналитики»
  • Воспроизводить историю и конкретные примеры использования технологий 3D-моделирования в цифровых гуманитарных исследованиях и проектах по сохранению культурного наследия; Владеть основами 3D- моделирования, может создать несложную 3D- модель.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Что такое цифровые гуманитарные науки (Digital Humanities) и существуют ли они.
    Введение в цифровые гуманитарные науки, история становления. Обзор направлений. Обзор дискуссий вокруг Digital Humanities, их места в современной академической среде, их научного статуса.
  • Тема 2. Корпусные методы вне лингвистики: что и зачем считать в тексте; text mining и distant reading в гуманитарных областях
    Основные методы автоматического анализа текста и их применение за пределами компьютерной/корпусной лингвистики. Проблема репрезентативности литературного канона. «Дальнее чтение» (Distant Reading) Франко Моретти как способ объективизации филологического исследования. Макроанализ М. Джокерса. Идея «масштабируемого чтения». Расширение идеи на исторические тексты. Примеры дальнего чтения исторических источников.
  • Тема 3. Стилеметрия.
    История формальных исследований авторского стиля. Проблема спорного авторства и количественные подходы к её решению. Спорное авторство произведений Шекспира, «Записок федералиста», Шолохова и др. Пример раскрытия авторства Дж. Роулинг. Понятие идиостиля автора. Программный пакет stylo для определения авторства. Альтернативные инструменты (JGAAP, PyDelta).
  • Тема 4. Тематическое моделирование
    Математические основы тематического моделирование: метод латентного размещения Дирихле (LDA), латентно-семантический анализ. Инструменты тематического моделирования: Mallet, пакеты genism и BigARTM в Python, пакет topicmodels в R. Примеры тематического моделирования из разных областей гуманитарного знания.
  • Тема 5. Корпуса, библиотеки, цифровые издания: хранение и представление культурно-значимых текстов в электронном виде.
    История роста и развития электронных корпусов текстов. Обзор существующих корпусных ресурсов и их степени открытости. Нелингвистические применения корпусов. Цифровые издания: теория и практика. Стандарты цифровых изданий.
  • Тема 6 Первичная оцифровка текстов: технологии и методы.
    Оптическое распознавание символов (OCR): история и принципы работы. Современные средства распознавания. Коммерческие OCR-системы (FineReader) и свободные OCR-ниструменты (Tessaract).
  • Тема 7. Структурированная машиночитаемая разметка текста.
    Языки структурированной разметки текста (XML, HTML), их синтаксис и предназначение. Стандарт кодирования культурно-значимой информации TEI (Text Encoding Initiative). Программные средства работы с XML и TEI/XML.
  • Тема 8. Построение моделей для цифровых гуманитарных исследований.
    Виды моделирования в гуманитарных науках. Особенности построения моделей для представления объектов культуры. Онтология как модель. Средства разработки онтологий и инженерии знаний.
  • Тема 9. Геоинформационные системы.
    Основные термины и понятия картографии и пространственного анализа. Координаты и их типы. Виды проекций. Типы геоданных. Свободные инструменты для работы с геоданными и пространственного анализа.
  • Тема 10. Геоинформационные системы.
    Основные термины и понятия картографии и пространственного анализа. Координаты и их типы. Виды проекций. Типы геоданных. Свободные инструменты для работы с геоданными и пространственного анализа.
  • Тема 11. Сетевой анализ в гуманитарных науках.
    Математический граф и его основные элементы (ребра, вершины). Применение теории графов в анализе социальных сетей. История становления сетевого анализа в гуманитарных областях. Социологические и антропологические исследования с использованием теории графов. Применение сетевого анализа в литературоведении, исторической науке, исследованиях культурных феноменов.
  • Тема 12. Информационные технологии в музейной сфере.
    Построение ИТ-систем в современном музее. Использование технологий 3D моделирования, дополненной, виртуальной и смешанной реальности в музейном деле. Организация виртуального музея.
  • Анализ изображений в цифровых гуманитарных исследованиях и «культурная аналитика».
    Методы анализа и обобщения цифровых изображений. Использование изображений из социальных сетей. Идея Cultural Analytics Льва Мановича.
  • Тема 14. 3D-моделирование объектов культурного наследия.
    История применения 3D технологий в гуманитарных исследованиях. Компьютерное моделирование в гуманитарных исследованиях. Типология виртуальных реконструкций. Технологии оцифровки объектов историко- культурного наследия и их репрезентации. Практикум по созданию виртуальной реконструкции.
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Активность на семинарах
  • неблокирующий Экзамен
    Экзамен проводится в устной форме сдачи проекта. Экзамен проводится на платформе MS Teams (https://teams.microsoft.com/l/team/19%3a518f054c2f2e42dd8dc64df8f8ce0556%40thread.tacv2/conversations?groupId=4587aa95-4885-4aa8-9c72-ae3b13af8aef&tenantId=21f26c24-0793-4b07-a73d-563cd2ec235f). К экзамену необходимо подключиться за 10 минут до начала. К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка MS Teams. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.1 * Активность на семинарах + 0.45 * Домашние задания + 0.45 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Bod, R. 1965-author. (2014). A New History of the Humanities : The Search for Principles and Patterns From Antiquity to the Present. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=683846
  • Lev Manovich. (2016). The Science of Culture? Social Computing, Digital Humanities and Cultural Analytics. Journal of Cultural Analytics. https://doi.org/10.31235/osf.io/b2y79
  • Schreibman, S., Siemens, R. G., & Unsworth, J. (2004). A Companion to Digital Humanities. Malden, MA: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=231516

Рекомендуемая дополнительная литература

  • Hoover, D. L., O’Halloran, K., & Culpeper, J. (2014). Digital Literary Studies : Corpus Approaches to Poetry, Prose, and Drama. New York: Routledge. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=697081
  • Manovich, L. (2013). Software Takes Command. London: Bloomsbury Academic. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=602510