Магистратура
2020/2021





Проектно-исследовательский семинар "Анализ данных в коммуникационных проектах"
Статус:
Курс обязательный (Коммуникации, основанные на данных)
Направление:
42.04.01. Реклама и связи с общественностью
Кто читает:
Школа коммуникаций
Где читается:
Факультет креативных индустрий
Когда читается:
1-й курс, 1-4 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Грызунова Елена Аркадьевна,
Егоров Дмитрий Владимирович,
Коточигов Константин Львович,
Нестер (Нестеренко) Роман Юрьевич,
Суворина Татьяна Владимировна
Прогр. обучения:
Коммуникации, основанные на данных
Язык:
русский
Кредиты:
15
Контактные часы:
160
Программа дисциплины
Аннотация
Настоящая дисциплина относится к блоку дисциплин «Практика(и), проектная и(или) научно-исследовательская работа». Для программы «Коммуникации, основанные на данных» данная дисциплина является обязательной. В результате успешного освоения курса студенты будут: • знать принципы работы с данными и способы модификации существующих решений для достижения результатов в области анализа коммуникационной среды; • уметь проводить медиа и аудиторное планирование; представить результат в формате презентации, отчета или интерактивного дэшборда для презентации клиенту; • владеть инструментами измерения и увеличения эффективности коммуникаций; методами анализа данных для изучения аудитории, составления портрета пользователя, оценки эффективности кампаний; статистическим анализом данных с использованием Python; инструментами визуализации данных с использованием Python, BI инструментов, презентаций.
Цель освоения дисциплины
- Целью дисциплины «Проектно-исследовательский семинар «Анализ данных в коммуникационных проектах» является освоение студентами аналитических и управленческих компетенций, необходимых для реализации прикладных коммуникационных проектов, основанных на данных.
Планируемые результаты обучения
- Знает, как устроен рекламный рынок, и какие игроки его представляют, взаимодействие между участниками.
- Знает, по каким метрикам бренды (компании) оценивают эффективность медиа и коммуникационных активностей.
- Знает современные инструменты и подходы, которые помогают рекламодателям увеличить эффективность коммуникации.
- Знает, какие оффлайн данные существуют, как собрать данные, как их использовать.
- Знает, как связывать разные типы данных.
- Знает, как получить данные из открытых источников.
- Знает принципы планирования рекламных активностей бренда.
- Имеет представление о современных тенденциях изменения потребительского поведения.
- Дает определение методам, которые использует в работе с данными, понимает принцип работы и способы модификации для достижения определенных результатов и предлагать новые решения
- Студент выбирает методы, подходы и инструменты для решения поставленных профессиональных задач, исходя из критического анализа существующей бизнеспрактики и обзора релевантных научных исследований.
- Понимает основные направления современных научных и проектных исследований, знает, какие данные нужны, как их собрать и с помощью чего обработать для проверки гипотезы, предлагает собственные гипотезы и составляет план проекта или научного исследования для решения своих задач.
- Знает индикаторы эффективной коммуникации
- Знает, какие онлайн данные существуют, как собрать данные, как их использовать.
- Знает специфику в области обеспечения безопасности данных и существующие юридические ограничения.
- Понимает и распознает индикаторы эффективной коммуникации, владеет инструментами измерения и увеличения эффективности, способен проводить медиа и аудиторное планирование, провести анализ эффективности текущих каналов и выбрать наиболее подходящие.
- Знает методы, которые используются во время работы с данными; принципы работы и способы модификации методов анализа данных для достижения определенных результатов; существующие методы решения задач сегментации аудитории для коммуникационных кампаний.
- Владеет когортным анализом
- Умеет проводить A/B-тестирование
- Владеет методом RFM-анализа аудитории. Умеет презентовать результат анализа данных в виде аналитической справки, отчета или презентации.
- Владеет инструментами мобильной аналитики
- Умеет комбинировать существующие методы анализа данных, разрабатывать новые подходы и обосновывать их целесообразность. Даёт рекомендации по разработке коммуникационных стратегий для различных аудиторных групп.
- Знает основные этапы методологии CRISP-DM; умеет формулировать шаги аналитического проекта в терминах методологии.
- Понимает основные принципы работы с текстовыми данными; умееет разрабатвать модели машинного обучения, использующие текстовые данные в качестве атрибутов.
- Понимает принципы работы рекомендательных систем; умеет использовать прикладные библиотеки для разработки простых сервисов рекомендаций.
- Умеет отбирать признаки для предиктивной модели; умеет выделять аномалии в данных.
- Способен объяснить научно-популярным языком принципы работы алгоритма, цели и задачи проекта, донести до клиентов, выступать на конференциях с кейсами.
- Составляет запросы к базам данных в SQL
- Знает основные библиотеки для анализа и визуализации данных в Python
- Владеет методами анализа данных для изучения аудитории, составления портрета пользователя. Владеет методами анализа данных в Python
- Владеет методом кластеризации для анализа аудитории с помощью библиотек Python.
- Считает и применяет метрики продуктовой аналитики.
- Использует инструменты измерения и увеличения эффективности коммуникаций.
- Представляет результаты анализа данных в формате презентации, отчета или интерактивного дэшборда ; объясняет научно-популярным языком принципы работы алгоритма, цели и задачи проекта.
Содержание учебной дисциплины
- Тема 1. Экосистема рекламного (digital) рынка и его эволюция.Как устроен рекламный рынок, и какие игроки его представляют, взаимодействие между участниками.
- Тема 2. Индикаторы эффективной коммуникации.По каким метрикам бренды (компании) оценивают эффективность медиа и коммуникационных активностей.
- Инструменты измерения эффективности.Обзор современных инструментов измерения эффективности маркетинговых активностей бренда. Понимание ожидаемых результатов на каждом из этапов коммуникационной воронки.
- Тема 4. Инструменты увеличения эффективности.Обзор современных инструментов и подходов, которые помогают рекламодателям увеличить эффективность коммуникации.
- Онлайн-данные.Какие онлайн-данные существуют, как собрать данные, как их использовать. Идентификация пользователя в онлайн среде, сильные и слабые стороны идентификаторов. Обзор существующих источников текстовых данных в онлайн среде и основных подходов анализа и использования данных.
- Тема 6. Оффлайн данные.Какие оффлайн данные существуют, как собрать данные, как их использовать.
- Тема 7. Онлайн + Оффлайн.Как связывают ранее не связанные типы данных. Обзор подходов и методов. Успешные примеры.
- Тема 8. Смежные источники данных и аналитикиМониторинг открытых источников и данные социальных сетей.
- Тема 9. От медиа планирования к аудиторному планированию.Изменение подходов к планированию рекламных активностей бренда.
- Безопасность данных.Безопасность данных, ограничения со стороны государства и влияние мировых рынков. Правовые аспекты работы с большими данными.
- От обезличенной коммуникации к персональной.Решение задач кросс-девайс коммуникации и задач омниканальности. Переход к единой коммуникации во всех используемых рекламных каналах, а также переход от коммуникации с устройствами пользователя к коммуникации с пользователем.
- Тема 12. Изменение потребительского поведения.Как меняется современное потребление, и какие технологии будут актуальны через 5 лет
- Тема 13. Анализ данных для решения задач рекламодателей.Ключевые концепты, основные тренды, AdTech, Data Market, основные проблемы. Обзор инструментов Data science и их применения в маркетинге. Полезные ресурсы.
- Базы данных и SQLКакие бывают базы данных, как работать с данными в БД, язык SQL. Фильтрация, группировка, составление подзапросов.
- Первичный анализ данных.Выгрузка и предобработка данных (GCP, bash), демонстрация основных методов Pandas, первые попытки описания аудитории, статистические сравнения групп пользователей. Демонстрация основных методов matplotlib, seaborn, plotly.
- Задачи обучения с учителем. Как построить свой Look-a-like.Алгоритмы классификации. Деревья решений и метод ближайших соседей. Как строится, работает, параметры и применение в реальных задачах. Линейные модели классификации и регрессии. Random Forest.Оценка эффективности алгоритмов. Модели оттока (churn). Как построить модель скоринга лидов.
- Обучение без учителя. Поиск групп среди аудитории сайта и построение персональной коммуникации.Метод главных компонент и кластеризация. Особенности применения PCA, выбор признаков, методы и метрики качества. Кластеризация пользователей методом машинного обучения. Выбор числа групп и алгоритма кластеризации. Метрики оценки качества кластеризации. Практическое применение и составление вариантов коммуникации под выбранные кластеры.
- Прикладные задачи продуктовой аналитики.KPI и метрики продуктовой аналитики. Как построить дерево метрик, расчет и использование метрик. Расчет и оптимизация воронки. Acquisition, Activation, Conversion, Retention, Expansion. Поиск точек роста.
- Оценка эффективности рекламных кампаний.Комплексная оценка метрик, моделирование атрибуции, эвристические и мультиканальные модели, их реализация и оценка эффективности РК.
- Визуализация и представление результатов.Как визуализировать отчет так, чтобы понравилось клиенту. Построение интерактивных дэшбордов. Обзор BI систем. Обзор возможностей визуализации данных в Google Studio. Практика визуализации данных в Tableau. Оформление результатов и презентация заказчику.
- Сегментация аудитории как инструмент эффективной коммуникации. Сравнение Rule-based и AI подходов.Для чего и как используют сегментацию аудитории в маркетинге. Rule based vs AI сегментация. Комбинированные стратегии. Customer-centric подход или метод пяти W. Персоны клиентов и их потребности, Скоринг персон, ABCDX сегментация, Customer Journey Map.
- RFM-анализ для сегментации пользователей по транзакционным данным. Визуализация. Предсказание Lifetime Value пользователей.RFM анализ для сегментации пользователей. Зачем нужен, область применения, алгоритмы. Как использовать в коммуникациях. Предсказание Lifetime Value пользователей. Отслеживание статусов RFM и LF, причин перемещения пользователей из сегмента в сегмент и планирование соответствующей коммуникации.
- Когортный анализ.Что такое когорты. Как строить и использовать когортный анализ. Предсказание mau на основе когорт и ретешнена. Предобработка данных в питоне, расчет когорт и анализ результатов.
- A/B-тестирование и эксперименты.Что такое АБ тесты, для чего нужны, как их проектировать, проводить, анализировать результаты. Дизайн экспримента и метрики, расчет размера выборки, применение статистических критериев, бутстреп, методы ускорения тестов. Проверка гипотез.
- Особенности мобильной аналитики.Мобильная аналитика - обзор инструментов. Особенность анализа транзакций из сторов. Особенности мобильных платформ. ASO и оптимизация в сторах.
- Workshop по решению задач продуктовой и маркетинговой аналитики.Решение кейсов и обсуждение мини-проектов. Growth hacking.
- Введение в проектную работуОсобенности реализации коммуникационных проектов, основанных на данных: бизнес-практика, кейсы. Требования к курсовым проектам и групповой проектной работе. Презентация и обсуждение планов курсовых проектов и групповых проектов.
- Критический анализ источников, обзор литературы.Поиск и подбор релевантных источников. Критическое чтение. Синтез и анализ. Структура обзора литературы. Экспертное интервью как формат сбора данных об актуальной бизнес-практике.
- Методология анализа данных CRISP-DM.Разбор шагов методологии по каждому из этапов процесса (понимание бизнес-задач, сбор и начальное изучение данных, подготовка данных, моделирование, оценка, внедрение). Обзор типовых задач, решаемых в рамках каждого из шагов.
- Обработка естественного языка и интеллектуальный анализ текста.Предварительная обработка текстовых данных: токены, N-граммы. Тематическое моделирование. Извлечение информации и кластеризация. Байесовская классификация текстов. Анализ тональности текстов. Глубокое обучение в интеллектуальном анализе текста. Обзор практик применения интеллектуального анализа текстов для прикладных исследований в области рекламы и связей с общественностью (анализ потребительских предпочтений, оценка репутации, мониторинг трендов и др.)
- Рекомендательные системы.Постановка задачи генерации рекомендаций. Обзор классических подходов - content-based рекомендации, коллаборативная фильтрация, методы, основанные на разложении матрицы предпочтений. Реализация методов на python. Обзор библиотек машинного обучения для разработки сервисов рекомендаций.
- Подготовка данных для предиктивных моделей.Отбор признаков для предиктивной модели. Разбор основных методик отбора признаков. Методы поиска аномалий в данных.
- Коммуникационные проекты, основанные на данных.Презентация и обсуждение курсовых проектов.
Элементы контроля
- Решение бизнес-кейса
- Домашнее задание по анализу аудитории
- Мини-проект: анализ рекламной кампании
- Обзор источников по теме курсового проектаОбзор источников представляется в виде устного выступления и презентации.
- Презентация плана индивидуального курсового проекта.Студенту необходимо представить план курсовой работы - индивидуального курсового проекта в форме мультимедийной презентации и устного выступления с последующими ответами на вопросы преподавателя и других студентов.Содержание презентации должно включать в себя: техническое задание, цели и задачи проекта; краткий обзор актуальных практик, анализ рынка, ситуационный анализ; подробное описание этапов работы над проектом.
- Презентация плана группового проекта.Проектной группе необходимо представить план группового проекта в форме мультимедийной презентации и устного выступления с последующими ответами на вопросы преподавателя и других студентов. Презентация должна включать в себя описание бизнес-задачи и её решения с помощью методов анализа данных. Оценка – общая для проектной группы.
- Предзащита курсового проектаСтуденту необходимо представить презентацию результатов курсового проекта. Выступление на 10 минут, презентация от 10 слайдов, а также ответить на вопросы преподавателя по курсовому проекту.
- Домашнее задание на построение скоринговой модели
- Домашнее задание по сегментации аудитории
- Домашнее задание: препроцессинг данных и отбор признаков
- Домашнее задание: обработка естественного языка
- Домашнее задание: рекомендательная система
- Домашнее задание: отчёт согласно методологии CRISP-DM
- Мини-проект по коммуникациям, основанным на данных
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.075 * Домашнее задание на построение скоринговой модели + 0.075 * Домашнее задание по анализу аудитории + 0.075 * Домашнее задание по сегментации аудитории + 0.075 * Домашнее задание: обработка естественного языка + 0.05 * Домашнее задание: отчёт согласно методологии CRISP-DM + 0.075 * Домашнее задание: препроцессинг данных и отбор признаков + 0.05 * Домашнее задание: рекомендательная система + 0.075 * Мини-проект по коммуникациям, основанным на данных + 0.075 * Мини-проект: анализ рекламной кампании + 0.075 * Обзор источников по теме курсового проекта + 0.1 * Предзащита курсового проекта + 0.05 * Презентация плана группового проекта. + 0.075 * Презентация плана индивидуального курсового проекта. + 0.075 * Решение бизнес-кейса
Список литературы
Рекомендуемая основная литература
- Foster, I., Ghani, R., Jarmin, R. S., Kreuter, F., & Lane, J. I. (2017). Big Data and Social Science : A Practical Guide to Methods and Tools. Boca Raton: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1353316
- Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
- King R. S. Cluster Analysis and Data Mining: An Introduction. - Mercury Learning, 2015. - ЭБС Books 24x7.
- Malik, U., Goldwasser, M., & Johnston, B. (2019). SQL for Data Analytics : Perform Fast and Efficient Data Analysis with the Power of SQL. Packt Publishing.
- Martin Oberhofer, Eberhard Hechler, Ivan Milman, Scott Schumacher, & Dan Wolfson. (2014). Beyond Big Data : Using Social MDM to Drive Deep Customer Insight. [N.p.]: IBM Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1600785
- Shmueli, G., Bruce, P. C., Gedeck, P., & Patel, N. R. (2020). Data Mining for Business Analytics : Concepts, Techniques and Applications in Python. Newark: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2273611
Рекомендуемая дополнительная литература
- Nelson, G. S. (2018). The Analytics Lifecycle Toolkit : A Practical Guide for an Effective Analytics Capability. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1727899
- Szabó, G., & Boykin, O. (2019). Social Media Data Mining and Analytics. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1899346