• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ключевые дисциплины

Digital Humanities

Цель курса — познакомить студентов с новыми исследовательскими подходами и задачами в литературоведении, лингвистике, истории, культурологии и философии, базирующимися на применении методов компьютерной обработки текста, анализа и визуализации данных в гуманитарных областях. Эти методы включают в себя создание и анализ корпусов текстов, построение статистических моделей, работу с большими данными, формализацию параметров текста, картографирование и т.п. Задача курса состоит в том, чтобы показать потенциал цифровых методов в гуманитарных исследованиях и снабдить студентов практическими навыками их применения. Курс включает в себя теоретический и практический компоненты.

Теоретическая часть курса Digital Humanities  

  • Цифровая публикация культурно-значимых текстов и теории электронных изданий, в т.ч. семантических изданий
  • Современные исследования художественного творчества с применением цифровых технологий и идеи «дальнего чтения» (т.н. distant reading)
  • Электронная картография
  • Сетевой анализ в гуманитарных областях
  • Визуальные технологии в современной культуре

Практическая часть курса курса Digital Humanities

  • Корпусная и компьютерная лингвистика; текстометрия и стилометрия
  • Технологии структурированной разметки текстов (XML, TEI/XML, JSON)
  • Базы данных и их применение в гуманитарных областях
  • Построение, анализ и визуализация сетей в гуманитарных областях; способы формализации сетевых данных
  • Геоинформационные системы
  • Трехмерное моделирование культурных объектов

Введение в науку о данных

Количественные исследования в любой области современной науки опираются на общий набор ключевых компетенций:

  • знание математической статистики и методов количественного анализа данных;
  • владение элементами компьютерных наук, связанными с манипуляцией большими объемами данных (сбор, очистка, подбор подходящей структуры для формального представления) и методами их визуализации;
  • прикладные навыки в области машинного обучения.

Цель курса — снабдить студентов теоретическими и практическими компетенциями во всех трех областях.

Эволюция гуманитарного знания

В курсе рассматривается история гуманитарного знания и научного поиска в гуманитарных областях от Античности до XXI века. На протяжении веков интеллектуалы самых разных культур и традиций проявляли стремление к поиску закономерностей и общей логики развития в произведениях человеческой культуры — музыке, живописи, словесности, фольклоре. Вопреки стереотипу о субъективно-герменевтическом характере гуманитарных областей (который обычно противопоставляется объективным методам естественных дисциплин), история гуманитарной научной мысли знает множество попыток сделать универсальные обобщения, выявить законы эволюции культуры на основе анализа больших выборок, построить строгую формальную модель культурного объекта.

Сегодня исследования такого рода вновь становятся актуальными и «переоткрываются» в связи с цифровым поворотом в гуманитарных науках. С одной стороны, с появлением информационных технологий многие масштабные исследовательские программы перестали быть неосуществимыми — самые тяжелые и трудоемкие их элементы теперь можно переложить на машину. С другой стороны, достижения математики, статистики и компьютерных наук подсказывают новые пути и подходы для исследований культурных объектов. Обсуждению этих подходов, а также связанных с ними сложностей и перспектив, будет посвящена основная часть курса.

Программирование на Python

Курс знакомит с основами функционального и объектно-ориентированного программирования, их применения для обработки текстовых и числовых данных. Студенты учатся применять средства Python для решения статистических задач, осваивают инструменты машинного обучения, реализованные в Python, а также на практике знакомятся с библиотеками Python, применяемыми в современных научных исследованиях. Курс знакомит студентов с различными парадигмами программирования и основными особенностями архитектуры языка Python. Рассматриваются основы синтаксиса Python, типы данных, поддерживаемые в этом языке, его возможности по работе с файловой системой и операционной системой. Затем освещаются следующие темы:

  • Регулярные выражения в Python. Модуль re;
  • Морфологический анализ в Python. Лемматизация, стемминг, получение грамматических характеристик слова;
  • Автоматизация сбора данных в Интернете. Web-scraping;
  • Введение в объектно-ориентированное программирование (ООП). Классы, шаблоны, наследование;
  • Визуализация научных данных средствами языка Python.