• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Basics of Data Analysis in International Relations

2021/2022
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Course type:
Compulsory course
When:
2 year, 1, 2 module

Instructors

Программа дисциплины

Аннотация

Умение понимать, интерпретировать и презентовать данные является важным навыком в современном мире. Целью данного курса является дать слушателям основные инструменты для того, чтобы уметь критически анализировать результаты исследований, а также уметь описывать, визуализировать и презентовать такую информацию. Курс можно разбить на две части. В первой части мы научимся собирать данные с новостных сайтов (по определенной тематике или отрасли), формировать из них базу статей в виде таблицы и затем будем учиться работать с табличными данными – загружать и обрабатывать их, заполнять пропуски, считать описательные статистики. Вторая часть курса посвящена визуализации данных. Мы поговорим о том, как строить наглядные графики, как делать наши визуализации более эффективными и избегать искажения информации. Задание по сбору статей в рамках своей исследовательской задачи в журналистике, последующей их обработке и визуализации данных и защита полученного продукта в виде аналитической заметки станут финальным проектом курса.
Цель освоения дисциплины

Цель освоения дисциплины

  • Обучение студентов основам программирования на языке Python, а также получение студентом целостного представления о возможностях и ограничениях современных статистических методов.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Практика по визуализации данных в Tableau
    В последнем разделе мы познакомимся с инструментом для создания интерактивных визуализаций и аналитики Tableau: особенности интерфейса, функционал, импорт данных. Разбираем на практике создание разных видов графиков и их экспорт. Создание дашбордов и визуальных историй.
  • Визуализация данных: особенности восприятия, лучшие практики и ошибки
    В этой части курса мы концептуально поговорим про визуализацию информации. Особенности восприятия визуальной информации. Основные принципы хорошей визуализации и представления данных: как отличить хорошую визуализацию от плохой, как не ввести потребителя медиа в заблуждение и не обмануться самому. На практике продолжаем работать с таблицами в библиотеке Pandas: анализируем данные и графики – какие виды данных какие требуют визуализации? Как правильно интерпретировать визуально представленную информацию. Основные виды графиков и особенности их применения (круговая диаграмма, гистограмма, тренд, линейный график, диаграмма рассеяния, пузырьковый график и т.д.).
  • Введение в статистику и работу с данными
    В этой теме мы поговорим про источники данных, обсудим понятия выборки и генеральной совокупности, методы эксперимента и наблюдения. Поговорим, как работать с данными, как создавать новые переменные, как их описывать суммирующими статистиками, как посчитать корреляцию и в каких случаях можно сделать вывод о наличии причинно-следственной связи. Практика: научимся превращать данные, собранные с новостных сайтов, в таблицы при помощи программной библиотеки Pandas, записывать и загружать табличные данные и делать базовые операции: очистка данных, заполнение пропусков, создание новых переменных, агрегация данных.
  • Повторение основ программирования на Python
    Запуск программ в среде Jupyter Notebook. Получение результатов. Основные типы данных и операции с ними. Целые числа, ввод-вывод, применение арифметических операций для целых чисел. Основы работы с вещественными числами, округление. Простые операции со строками. Кортежи, списки, основные методы работы с кортежами и списками. Функция range, циклы for и while. Логический тип переменных, условный оператор if else. Множества и словари. Функции. Методы создания множеств. Словари, создание и примеры использования.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Защита домашнего задания
  • неблокирующий Командный проект
  • неблокирующий Онлайн-курс
  • неблокирующий Самостоятельные работы
  • неблокирующий Экзамен (письменный)
  • неблокирующий Бонусные баллы, kahoot
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    В случае, если полученная по формуле оценка меньше или равна 10, то она выставляется как итоговая. Если полученная по формуле оценка более 10, то в качестве итоговой оценки выставляется оценка 10.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392

Рекомендуемая дополнительная литература

  • Frederick J Gravetter, Larry B. Wallnau, Lori-Ann B. Forzano, & James E. Witnauer. (2020). Essentials of Statistics for the Behavioral Sciences, Edition 10. Cengage Learning.