Магистратура
2023/2024
Программирование для анализа городских данных
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Цифровая урбанистика и аналитика города)
Направление:
07.04.04. Градостроительство
Кто читает:
Высшая школа урбанистики имени А.А. Высоковского
Где читается:
Факультет городского и регионального развития
Когда читается:
1-й курс, 2 семестр
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Кульчицкий Юрий Викторович
Прогр. обучения:
Цифровая урбанистика и аналитика города
Язык:
русский
Кредиты:
6
Контактные часы:
28
Программа дисциплины
Аннотация
Современный городской планировщик и исследователь должен быть в курсе процессов, которые можно изучать с помощью новых источников данных и инструментов анализа. В современном урбанизированном мире ежедневно генерируются огромные объемы данных: от жалоб и отчетов граждан до их поисковых запросов, ежедневные перемещения, показания счетчиков электроэнергии и т.д. Анализ этих данных создает новые возможности для изучения городских явлений и позволяет использовать новые научные подходы в городском планировании и управлении. Необычайный объем и многомерность городских данных требуют изучения новых инструментов и методов сбора и получения таких данных, придания им определенной формы, подходящей для анализа, и проведения самого анализа.
Курс знакомит студентов с типами данных (особенно пространственными данными), имеющими отношение к городским исследованиям, передовыми инструментами работы с такими данными, полным процессом анализа данных: от сбора данных и их визуализации до трактовки, выводов и представления результатов. Конкретные темы включают сбор данных, обработку и подготовку данных, исследовательский анализ, статистический анализ (базовая регрессия и введение в пространственную автокорреляцию и регрессию), визуализацию данных и воспроизводимую отчетность. В ходе курса студенты будут использовать язык статистического программирования R и RStudio IDE (интегрированную среду разработки), но концепции, используемые в курсе, и приобретенные навыки могут быть применены в Python, Julia или любом другом языке программирования с библиотеками анализа данных.
Цель освоения дисциплины
- Познакомить учащихся с различными типами источников городских данных, типами файлов и баз данных, используемыми для хранения таких данных.
- Понимать происхождение и связанные с ним ограничения различных источников городских данных.
- Освоить и демонстрировать методы визуализации и EDA в городском планировании и исследованиях.
- Понимать и объяснять значимость временного и пространственного измерения городских данных.
- Понимать и объяснять, как городские данные структурируются и хранятся.
- Выработать аналитические навыки применения статистических методов анализа к большим и компактным наборам городских данных.
- Понимать и уметь объяснить базовые принципы EDA (эксплораторного анализа данных)
- Освоить методы донесения результатов исследования с помощью визуализаций и таблиц.
Планируемые результаты обучения
- Иллюстрировать особенности реализации платформенного и экосистемного подходов в построении взаимодействия между городами и Smart City-проектами
- Получать городские пространственные данные из различных источников.
- Студент может создавать скрипты для анализа данных
- Уметь писать скрипты на языке R
Содержание учебной дисциплины
- 01. Введение в городские данные и smart cities
- 02. Введение в скриптовые инструменты анализа данных и проведение воспроизводимых исследований
- 03. Предварительные исследования данных (EDA) и базовые техники визуализации
- 04. Виды и источники городских данных. Ключевые наборы открытых городских данных и базовые техники работы с ними
- 06. Элементы математической статистики, базовые процедуры исследования наборов данных перед оценкой регрессионных и иных моделей. Методы оценки эффективности предсказательных моделей
Элементы контроля
- Лабораторная 01 - вводная
- Лабораторная 02. Таблицы, базовый ГИС
- Лабораторная 03. Научные графики, ggplot2
- Лабораторная 04. Регрессионные модели
- Обязательные курсы DataCamp
- Курсы по выбору в системе DataCamp
- Экзамен
Промежуточная аттестация
- 2023/2024 учебный год II семестр0.15 * Курсы по выбору в системе DataCamp + 0.1 * Лабораторная 01 - вводная + 0.1 * Лабораторная 02. Таблицы, базовый ГИС + 0.15 * Лабораторная 03. Научные графики, ggplot2 + 0.15 * Лабораторная 04. Регрессионные модели + 0.05 * Обязательные курсы DataCamp + 0.3 * Экзамен