Ключевые дисциплины
Digital Humanities
Цель курса — познакомить студентов с новыми исследовательскими подходами и задачами в литературоведении, лингвистике, истории, культурологии и философии, базирующимися на применении методов компьютерной обработки текста, анализа и визуализации данных в гуманитарных областях. Эти методы включают в себя создание и анализ корпусов текстов, построение статистических моделей, работу с большими данными, формализацию параметров текста, картографирование и т.п. Задача курса состоит в том, чтобы показать потенциал цифровых методов в гуманитарных исследованиях и снабдить студентов практическими навыками их применения. Курс включает в себя теоретический и практический компоненты.
Теоретическая часть курса Digital Humanities
- Цифровая публикация культурно-значимых текстов и теории электронных изданий, в т.ч. семантических изданий
- Современные исследования художественного творчества с применением цифровых технологий и идеи «дальнего чтения» (т.н. distant reading)
- Электронная картография
- Сетевой анализ в гуманитарных областях
- Визуальные технологии в современной культуре
Практическая часть курса курса Digital Humanities
- Корпусная и компьютерная лингвистика; текстометрия и стилометрия
- Технологии структурированной разметки текстов (XML, TEI/XML, JSON)
- Базы данных и их применение в гуманитарных областях
- Построение, анализ и визуализация сетей в гуманитарных областях; способы формализации сетевых данных
- Геоинформационные системы
- Трехмерное моделирование культурных объектов
Анализ данных
Количественные исследования в любой области современной науки опираются на общий набор ключевых компетенций:
- знание математической статистики и методов количественного анализа данных;
- владение элементами компьютерных наук, связанными с манипуляцией большими объемами данных (сбор, очистка, подбор подходящей структуры для формального представления) и методами их визуализации;
- прикладные навыки в области машинного обучения.
Цель курса — снабдить студентов теоретическими и практическими компетенциями во всех трех областях.
Программирование на Python
Курс знакомит с основами функционального и объектно-ориентированного программирования, их применения для обработки текстовых и числовых данных. Студенты учатся применять средства Python для решения статистических задач, осваивают инструменты машинного обучения, реализованные в Python, а также на практике знакомятся с библиотеками Python, применяемыми в современных научных исследованиях. Курс знакомит студентов с различными парадигмами программирования и основными особенностями архитектуры языка Python. Рассматриваются основы синтаксиса Python, типы данных, поддерживаемые в этом языке, его возможности по работе с файловой системой и операционной системой. Затем освещаются следующие темы:
- Регулярные выражения в Python. Модуль re;
- Морфологический анализ в Python. Лемматизация, стемминг, получение грамматических характеристик слова;
- Автоматизация сбора данных в Интернете. Web-scraping;
- Введение в объектно-ориентированное программирование (ООП). Классы, шаблоны, наследование;
- Визуализация научных данных средствами языка Python.
