• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ключевые дисциплины

Digital Humanities

Цель курса — познакомить студентов с новыми исследовательскими подходами и задачами в литературоведении, лингвистике, истории, культурологии и философии, базирующимися на применении методов компьютерной обработки текста, анализа и визуализации данных в гуманитарных областях. Эти методы включают в себя создание и анализ корпусов текстов, построение статистических моделей, работу с большими данными, формализацию параметров текста, картографирование и т.п. Задача курса состоит в том, чтобы показать потенциал цифровых методов в гуманитарных исследованиях и снабдить студентов практическими навыками их применения. Курс включает в себя теоретический и практический компоненты.

Теоретическая часть курса Digital Humanities  

  • Цифровая публикация культурно-значимых текстов и теории электронных изданий, в т.ч. семантических изданий
  • Современные исследования художественного творчества с применением цифровых технологий и идеи «дальнего чтения» (т.н. distant reading)
  • Электронная картография
  • Сетевой анализ в гуманитарных областях
  • Визуальные технологии в современной культуре

Практическая часть курса курса Digital Humanities

  • Корпусная и компьютерная лингвистика; текстометрия и стилометрия
  • Технологии структурированной разметки текстов (XML, TEI/XML, JSON)
  • Базы данных и их применение в гуманитарных областях
  • Построение, анализ и визуализация сетей в гуманитарных областях; способы формализации сетевых данных
  • Геоинформационные системы
  • Трехмерное моделирование культурных объектов

Анализ данных

Количественные исследования в любой области современной науки опираются на общий набор ключевых компетенций:

  • знание математической статистики и методов количественного анализа данных;
  • владение элементами компьютерных наук, связанными с манипуляцией большими объемами данных (сбор, очистка, подбор подходящей структуры для формального представления) и методами их визуализации;
  • прикладные навыки в области машинного обучения.

Цель курса — снабдить студентов теоретическими и практическими компетенциями во всех трех областях.

Программирование на Python

Курс знакомит с основами функционального и объектно-ориентированного программирования, их применения для обработки текстовых и числовых данных. Студенты учатся применять средства Python для решения статистических задач, осваивают инструменты машинного обучения, реализованные в Python, а также на практике знакомятся с библиотеками Python, применяемыми в современных научных исследованиях. Курс знакомит студентов с различными парадигмами программирования и основными особенностями архитектуры языка Python. Рассматриваются основы синтаксиса Python, типы данных, поддерживаемые в этом языке, его возможности по работе с файловой системой и операционной системой. Затем освещаются следующие темы:

  • Регулярные выражения в Python. Модуль re;
  • Морфологический анализ в Python. Лемматизация, стемминг, получение грамматических характеристик слова;
  • Автоматизация сбора данных в Интернете. Web-scraping;
  • Введение в объектно-ориентированное программирование (ООП). Классы, шаблоны, наследование;
  • Визуализация научных данных средствами языка Python.