2020/2021
Цифровые методы в гуманитарных науках, часть 2
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Майнор
Кто читает:
Школа лингвистики
Где читается:
Факультет гуманитарных наук
Когда читается:
4 модуль
Преподаватели:
Скоринкин Даниил Андреевич,
Фишер Франк
Язык:
русский
Кредиты:
3
Контактные часы:
26
Программа дисциплины
Аннотация
Современные методы цифровых гуманитарных исследований все больше опираются на работу с большими данными, создание и анализ корпусов текстов со структурированной машиночитаемой разметкой (XML/HTML), картографирование и применение геоинформационных систем, использование открытых данных и свободных баз знаний. Курс призван студентам исследовательский потенциал этих методов и вооружить их практическими навыками цифровых гуманитарных исследований.
Цель освоения дисциплины
- Освоение подходов и стандартов в области работы с гуманитарными данными в цифровой форме, освоение технологий и инструментов, позволяющих самостоятельно осуществлять цифровые гуманитарные исследования.
Планируемые результаты обучения
- знает современные практики и международные стандарты сохранения культурного наследия в цифровой форме (digital preservation)
- понимает место и предназначение структурированной разметки текста (HTML, XML, TEI-XML) в количественных гуманитарных исследованиях
- умеет создавать и использовать в исследовательской работе XML-разметку;
- умеет применять системы геоинформационного анализа и геопривязки для исследований в гуманитарных областях
- умеет осуществлять запросы к открытой базе знаний Wikidata при помощи языка SPARQL
- владеет языком SPARQL-запросов для работы с базами знаний на основе стандарта RDF
Содержание учебной дисциплины
- Философские основы Digital Humanities; возможности и вопросыЦифровые гуманитарные исследования как междисциплинарный научный проект поднима-ют сложные теоретические и методологические вопросы. Возникшие цифровые представле-ния различных объектов исследования гуманитариев (тексты, изображения, трехмерные объекты) требуют комплексного осмысления новых научных практик и их философских оснований. Эта часть курса посвящена осмыслению Digital Humanities как заметного направления в современной гуманитарной науке и проводится при участии школы филосо-фии факультета гуманитарных наук НИУ ВШЭ.
- Структурированная разметка текста при помощи XML. Международный стандарт сохранения текстового наследия TEI/XMLСтруктурированная машиночитаемая разметка (XML) позволяет превращать оцифрован-ный текст из цепочки символов в иерархически упорядоченный набор структурированных данных (и метаданных) с явно заданной привязкой к конкретным элементам текста. Это от-крывает богатые возможности как для цифрового сохранения культурного наследия, так и для исследования текстов цифровыми методами с опорой на разметку. Использование для кодирования значимой информации о тексте единого международного стандарта TEI/XML позволяет использовать готовые инструменты анализа и веб-представления размеченных текстов с минимальными усилиями. Эта часть курса посвящена знакомству с XML, TEI/XML и базовыми средствами работы с ними.
- Геоинформационные системы (GIS). Применение GIS в гуманитарных исследованиях.Основные компоненты геоинформационных систем. Географические данные в гуманитар-ных науках. Карты прошлого: исторические геоинформационные системы. Геоинформатика в литературоведении. Использование открытых электронных картографических инструментов
- Открытые источники машиночитаемой структурированной информации. Wikidata. Формат моделирования и хранения знаний RDFСемантический веб и связанные открытые данные (linked open data). Общедоступные базы данных (Wikidata, DBPedia, FOAF) и работа с ними; онтологии (SOWA, Dublin Core) и их применение. Использование Wikidata в научном исследовании: постановка вопроса, получе-ние данных, визуализация, количественный анализ, качественная интерпретация.
Элементы контроля
- Сдача исследовательского проекта 1 (геоинформационная система)
- Сдача исследовательского проекта 2 (исследование с применением машиночитаемых данных)
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.5 * Сдача исследовательского проекта 1 (геоинформационная система) + 0.5 * Сдача исследовательского проекта 2 (исследование с применением машиночитаемых данных)
Список литературы
Рекомендуемая основная литература
- - Основы XML - Национальный Открытый Университет "ИНТУИТ" - 2016 - 436с. - ISBN: - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100354
- Bod, R. 1965-author. (2014). A New History of the Humanities : The Search for Principles and Patterns From Antiquity to the Present. Oxford: OUP Oxford. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=683846
- Burnard, L. (2014). What is the Text Encoding Initiative? France, Europe: OpenEdition Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.3FB145E0
- Klaus Graf. (2011). List of Digital Humanities GIS (Geographical Information Systems) projects. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EFA58334
- Антониоу Г., Грос П., Хармелен ван Ф. - Семантический веб - Издательство "ДМК Пресс" - 2016 - 240с. - ISBN: 978-5-97060-333-8 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/69963
Рекомендуемая дополнительная литература
- Farda-Sarbas, M., & Müller-Birn, C. (2019). Wikidata from a Research Perspective —— A Systematic Mapping Study of Wikidata. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsarx&AN=edsarx.1908.11153
- Lévy-Bruhl, L. (2018). The Philosophy of Auguste Comte. New York: SNOVA. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1855161
- VRANDEČIĆ, D., & KRÖTZSCH, M. (2014). Wikidata: A Free Collaborative Knowledgebase. Communications of the ACM, 57(10), 78–85. https://doi.org/10.1145/2629489
- Wikidata: A large-scale collaborative ontological medical database. (2019). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.33EA9317