Бакалавриат
2019/2020
Основы анализа и визуализации данных для медиа
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Журналистика)
Направление:
42.03.02. Журналистика
Где читается:
Факультет креативных индустрий
Когда читается:
4-й курс, 1 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Рогович Татьяна Владимировна
Язык:
русский
Кредиты:
3
Контактные часы:
38
Программа дисциплины
Аннотация
Умение понимать, интерпретировать и презентовать статистические данные является важным навыком в современном мире. Целью данного курса является дать слушателям основные инструменты для того, чтобы уметь критически анализировать результаты исследований, а также уметь описывать, визуализировать и презентовать такую информацию. В рамках курса мы ответим на вопросы: насколько правдивы утверждения, что курение вызывает серьезные болезни? Если 86% опрошенных что-то поддерживают, значит ли что 86% населения страны думает так же? Чем перепись населения отличается от опроса? Как представить эту информацию графически, не исказив за счет неудачно выбранных инструментов? Курс можно разбить на две части. В первой мы познакомимся с базовыми понятиями статистики (выборка, распределение, доверительные интервалы, меры и разброса, и т.д.), разберемся когда и какие выводы можно делать на основании тех или иных данных. Поговорим, что такое корреляция и тестирование гипотез. Вторая часть курса посвящена визуализации данных. Мы поговорим о том, как наш мозг воспринимает визуальную информацию, как делать наши визуализации более эффективными и избегать искажения информации. На практике мы будет работать с инструментом для визуализации данных Tableau, Задание по визуализации данных и его защита станут финальным проектом курса.
Цель освоения дисциплины
- Развитие у студентов навыка чтения, интерпретации и оценки качества анализа и представления количественных данных
- Освоение инструмента визуализации количественной информации
- Формирование навыка оценки качества визуализации данных и ее корректности
Планируемые результаты обучения
- Различать и интерпретировать базовые описательные статистики, виды переменных
- Интерпретировать результаты простых экспериментальных исследований и опросов
- Считать базовые описательные статистики (меры центральности, разброса и т.д.)
- Выбирать корректный вид визуализации для данных
- Знать главные когнитивные особенности восприятия визуальной информации и опираться на них при создании визуализаций
- Различать плохие примеры визуализации данных и уметь обосновывать свое мнение
- Замечать ошибки, допущенные при визуализации данных (искажение трендов и информации и т.д.) и избегать их при создании своих визуализаций
- Создавать визуализации количественных данных с помощью Tableau
Содержание учебной дисциплины
- Введение в статистику и работу с даннымиПеред тем как переходить непосредственно к визуализации данных, нужно узнать как отличить корректно собранные данные от тех, которым не повезло. В этой теме мы поговорим про источники данных, обсудим понятия выборки и генеральной совокупности, методы эксперимента и наблюдения. Поговорим, как работать с данными, как создавать новые переменные, как их описывать суммирующими статистиками, как посчитать корреляцию и в каких случаях можно сделать вывод о наличии причинно-следственной связи. Практика: научимся превращать данные в таблицы, загружать данные в Google таблицы и делать базовые операции: очистка данных, заполнение пропусков, создание новых переменных, агрегация данных.
- Визуализация данных: особенности восприятия, лучшие практики и ошибкиВо второй части курса мы концептуально поговорим про визуализацию информации. Особенности восприятия визуальной информации. Основные принципы хорошей визуализации и представления данных: как отличить хорошую визуализацию от плохой, как не ввести потребителя медиа в заблуждение и не обмануться самому. На практике продолжаем работать с Google таблицами: анализируем данные и графики - какие виды данных какой требуют презентации? Как правильно интерпретировать визуально представленную информацию. Основные виды графиков и особенности их применения (круговая диаграмма, гистограмма, тренд, линейный график, диаграмма рассеяния, пузырьковый график и т.д.). Основы сетевого анализа и интерпретация визуализаций сетей.
- Практика по визуализации данных в TableauВ третьем разделе мы познакомимся с инструментом для создания интерактивных визуализаций и аналитики Tableau: особенности интерфейса, функционал, импорт данных. Разбираем на практике создание разных видов графиков и их экспорт. Создание дашбордов и визуальных историй.
Элементы контроля
- Контрольные работыДве контрольные работы в течение курса. Общая оценка за КР = (КР1 + КР2)/2.
- Домашнее задание
- ЭкзаменФинальный проект по визуализации и анализу данных с устной защитой на данных по выбору.
Промежуточная аттестация
- Промежуточная аттестация (1 модуль)0.15 * Домашнее задание + 0.6 * Контрольные работы + 0.25 * Экзамен
Список литературы
Рекомендуемая основная литература
- Yau, N. (2013). Data Points : Visualization That Means Something. New York: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=566405
- Математико - статистические модели в социологии : математическая статистика для социологов: учеб. пособие, Толстова, Ю. Н., 2007
Рекомендуемая дополнительная литература
- Anoshin, D., Matic, T., Bogdanovic, S., Lincoln, T., & Shirokov, D. (2019). Tableau 2019.x Cookbook : Over 115 Recipes to Build End-to-end Analytical Solutions Using Tableau. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2022993
- Joshua N. Milligan. (2019). Learning Tableau 2019 : Tools for Business Intelligence, Data Prep, and Visual Analytics, 3rd Edition. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2092866