• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2020/2021

Проектно-исследовательский семинар "Анализ данных в коммуникационных проектах"

Статус: Курс обязательный (Коммуникации, основанные на данных)
Направление: 42.04.01. Реклама и связи с общественностью
Когда читается: 1-й курс, 1-4 модуль
Формат изучения: без онлайн-курса
Преподаватели: Грызунова Елена Аркадьевна, Егоров Дмитрий Владимирович, Коточигов Константин Львович, Нестер (Нестеренко) Роман Юрьевич, Суворина Татьяна Владимировна
Прогр. обучения: Коммуникации, основанные на данных
Язык: русский
Кредиты: 15
Контактные часы: 160

Программа дисциплины

Аннотация

Настоящая дисциплина относится к блоку дисциплин «Практика(и), проектная и(или) научно-исследовательская работа». Для программы «Коммуникации, основанные на данных» данная дисциплина является обязательной. В результате успешного освоения курса студенты будут: • знать принципы работы с данными и способы модификации существующих решений для достижения результатов в области анализа коммуникационной среды; • уметь проводить медиа и аудиторное планирование; представить результат в формате презентации, отчета или интерактивного дэшборда для презентации клиенту; • владеть инструментами измерения и увеличения эффективности коммуникаций; методами анализа данных для изучения аудитории, составления портрета пользователя, оценки эффективности кампаний; статистическим анализом данных с использованием Python; инструментами визуализации данных с использованием Python, BI инструментов, презентаций.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью дисциплины «Проектно-исследовательский семинар «Анализ данных в коммуникационных проектах» является освоение студентами аналитических и управленческих компетенций, необходимых для реализации прикладных коммуникационных проектов, основанных на данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает, как устроен рекламный рынок, и какие игроки его представляют, взаимодействие между участниками.
  • Знает, по каким метрикам бренды (компании) оценивают эффективность медиа и коммуникационных активностей.
  • Знает современные инструменты и подходы, которые помогают рекламодателям увеличить эффективность коммуникации.
  • Знает, какие оффлайн данные существуют, как собрать данные, как их использовать.
  • Знает, как связывать разные типы данных.
  • Знает, как получить данные из открытых источников.
  • Знает принципы планирования рекламных активностей бренда.
  • Имеет представление о современных тенденциях изменения потребительского поведения.
  • Дает определение методам, которые использует в работе с данными, понимает принцип работы и способы модификации для достижения определенных результатов и предлагать новые решения
  • Студент выбирает методы, подходы и инструменты для решения поставленных профессиональных задач, исходя из критического анализа существующей бизнеспрактики и обзора релевантных научных исследований.
  • Понимает основные направления современных научных и проектных исследований, знает, какие данные нужны, как их собрать и с помощью чего обработать для проверки гипотезы, предлагает собственные гипотезы и составляет план проекта или научного исследования для решения своих задач.
  • Знает индикаторы эффективной коммуникации
  • Знает, какие онлайн данные существуют, как собрать данные, как их использовать.
  • Знает специфику в области обеспечения безопасности данных и существующие юридические ограничения.
  • Понимает и распознает индикаторы эффективной коммуникации, владеет инструментами измерения и увеличения эффективности, способен проводить медиа и аудиторное планирование, провести анализ эффективности текущих каналов и выбрать наиболее подходящие.
  • Знает методы, которые используются во время работы с данными; принципы работы и способы модификации методов анализа данных для достижения определенных результатов; существующие методы решения задач сегментации аудитории для коммуникационных кампаний.
  • Владеет когортным анализом
  • Умеет проводить A/B-тестирование
  • Владеет методом RFM-анализа аудитории. Умеет презентовать результат анализа данных в виде аналитической справки, отчета или презентации.
  • Владеет инструментами мобильной аналитики
  • Умеет комбинировать существующие методы анализа данных, разрабатывать новые подходы и обосновывать их целесообразность. Даёт рекомендации по разработке коммуникационных стратегий для различных аудиторных групп.
  • Знает основные этапы методологии CRISP-DM; умеет формулировать шаги аналитического проекта в терминах методологии.
  • Понимает основные принципы работы с текстовыми данными; умееет разрабатвать модели машинного обучения, использующие текстовые данные в качестве атрибутов.
  • Понимает принципы работы рекомендательных систем; умеет использовать прикладные библиотеки для разработки простых сервисов рекомендаций.
  • Умеет отбирать признаки для предиктивной модели; умеет выделять аномалии в данных.
  • Способен объяснить научно-популярным языком принципы работы алгоритма, цели и задачи проекта, донести до клиентов, выступать на конференциях с кейсами.
  • Составляет запросы к базам данных в SQL
  • Знает основные библиотеки для анализа и визуализации данных в Python
  • Владеет методами анализа данных для изучения аудитории, составления портрета пользователя. Владеет методами анализа данных в Python
  • Владеет методом кластеризации для анализа аудитории с помощью библиотек Python.
  • Считает и применяет метрики продуктовой аналитики.
  • Использует инструменты измерения и увеличения эффективности коммуникаций.
  • Представляет результаты анализа данных в формате презентации, отчета или интерактивного дэшборда ; объясняет научно-популярным языком принципы работы алгоритма, цели и задачи проекта.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Экосистема рекламного (digital) рынка и его эволюция.
    Как устроен рекламный рынок, и какие игроки его представляют, взаимодействие между участниками.
  • Тема 2. Индикаторы эффективной коммуникации.
    По каким метрикам бренды (компании) оценивают эффективность медиа и коммуникационных активностей.
  • Инструменты измерения эффективности.
    Обзор современных инструментов измерения эффективности маркетинговых активностей бренда. Понимание ожидаемых результатов на каждом из этапов коммуникационной воронки.
  • Тема 4. Инструменты увеличения эффективности.
    Обзор современных инструментов и подходов, которые помогают рекламодателям увеличить эффективность коммуникации.
  • Онлайн-данные.
    Какие онлайн-данные существуют, как собрать данные, как их использовать. Идентификация пользователя в онлайн среде, сильные и слабые стороны идентификаторов. Обзор существующих источников текстовых данных в онлайн среде и основных подходов анализа и использования данных.
  • Тема 6. Оффлайн данные.
    Какие оффлайн данные существуют, как собрать данные, как их использовать.
  • Тема 7. Онлайн + Оффлайн.
    Как связывают ранее не связанные типы данных. Обзор подходов и методов. Успешные примеры.
  • Тема 8. Смежные источники данных и аналитики
    Мониторинг открытых источников и данные социальных сетей.
  • Тема 9. От медиа планирования к аудиторному планированию.
    Изменение подходов к планированию рекламных активностей бренда.
  • Безопасность данных.
    Безопасность данных, ограничения со стороны государства и влияние мировых рынков. Правовые аспекты работы с большими данными.
  • От обезличенной коммуникации к персональной.
    Решение задач кросс-девайс коммуникации и задач омниканальности. Переход к единой коммуникации во всех используемых рекламных каналах, а также переход от коммуникации с устройствами пользователя к коммуникации с пользователем.
  • Тема 12. Изменение потребительского поведения.
    Как меняется современное потребление, и какие технологии будут актуальны через 5 лет
  • Тема 13. Анализ данных для решения задач рекламодателей.
    Ключевые концепты, основные тренды, AdTech, Data Market, основные проблемы. Обзор инструментов Data science и их применения в маркетинге. Полезные ресурсы.
  • Базы данных и SQL
    Какие бывают базы данных, как работать с данными в БД, язык SQL. Фильтрация, группировка, составление подзапросов.
  • Первичный анализ данных.
    Выгрузка и предобработка данных (GCP, bash), демонстрация основных методов Pandas, первые попытки описания аудитории, статистические сравнения групп пользователей. Демонстрация основных методов matplotlib, seaborn, plotly.
  • Задачи обучения с учителем. Как построить свой Look-a-like.
    Алгоритмы классификации. Деревья решений и метод ближайших соседей. Как строится, работает, параметры и применение в реальных задачах. Линейные модели классификации и регрессии. Random Forest.Оценка эффективности алгоритмов. Модели оттока (churn). Как построить модель скоринга лидов.
  • Обучение без учителя. Поиск групп среди аудитории сайта и построение персональной коммуникации.
    Метод главных компонент и кластеризация. Особенности применения PCA, выбор признаков, методы и метрики качества. Кластеризация пользователей методом машинного обучения. Выбор числа групп и алгоритма кластеризации. Метрики оценки качества кластеризации. Практическое применение и составление вариантов коммуникации под выбранные кластеры.
  • Прикладные задачи продуктовой аналитики.
    KPI и метрики продуктовой аналитики. Как построить дерево метрик, расчет и использование метрик. Расчет и оптимизация воронки. Acquisition, Activation, Conversion, Retention, Expansion. Поиск точек роста.
  • Оценка эффективности рекламных кампаний.
    Комплексная оценка метрик, моделирование атрибуции, эвристические и мультиканальные модели, их реализация и оценка эффективности РК.
  • Визуализация и представление результатов.
    Как визуализировать отчет так, чтобы понравилось клиенту. Построение интерактивных дэшбордов. Обзор BI систем. Обзор возможностей визуализации данных в Google Studio. Практика визуализации данных в Tableau. Оформление результатов и презентация заказчику.
  • Сегментация аудитории как инструмент эффективной коммуникации. Сравнение Rule-based и AI подходов.
    Для чего и как используют сегментацию аудитории в маркетинге. Rule based vs AI сегментация. Комбинированные стратегии. Customer-centric подход или метод пяти W. Персоны клиентов и их потребности, Скоринг персон, ABCDX сегментация, Customer Journey Map.
  • RFM-анализ для сегментации пользователей по транзакционным данным. Визуализация. Предсказание Lifetime Value пользователей.
    RFM анализ для сегментации пользователей. Зачем нужен, область применения, алгоритмы. Как использовать в коммуникациях. Предсказание Lifetime Value пользователей. Отслеживание статусов RFM и LF, причин перемещения пользователей из сегмента в сегмент и планирование соответствующей коммуникации.
  • Когортный анализ.
    Что такое когорты. Как строить и использовать когортный анализ. Предсказание mau на основе когорт и ретешнена. Предобработка данных в питоне, расчет когорт и анализ результатов.
  • A/B-тестирование и эксперименты.
    Что такое АБ тесты, для чего нужны, как их проектировать, проводить, анализировать результаты. Дизайн экспримента и метрики, расчет размера выборки, применение статистических критериев, бутстреп, методы ускорения тестов. Проверка гипотез.
  • Особенности мобильной аналитики.
    Мобильная аналитика - обзор инструментов. Особенность анализа транзакций из сторов. Особенности мобильных платформ. ASO и оптимизация в сторах.
  • Workshop по решению задач продуктовой и маркетинговой аналитики.
    Решение кейсов и обсуждение мини-проектов. Growth hacking.
  • Введение в проектную работу
    Особенности реализации коммуникационных проектов, основанных на данных: бизнес-практика, кейсы. Требования к курсовым проектам и групповой проектной работе. Презентация и обсуждение планов курсовых проектов и групповых проектов.
  • Критический анализ источников, обзор литературы.
    Поиск и подбор релевантных источников. Критическое чтение. Синтез и анализ. Структура обзора литературы. Экспертное интервью как формат сбора данных об актуальной бизнес-практике.
  • Методология анализа данных CRISP-DM.
    Разбор шагов методологии по каждому из этапов процесса (понимание бизнес-задач, сбор и начальное изучение данных, подготовка данных, моделирование, оценка, внедрение). Обзор типовых задач, решаемых в рамках каждого из шагов.
  • Обработка естественного языка и интеллектуальный анализ текста.
    Предварительная обработка текстовых данных: токены, N-граммы. Тематическое моделирование. Извлечение информации и кластеризация. Байесовская классификация текстов. Анализ тональности текстов. Глубокое обучение в интеллектуальном анализе текста. Обзор практик применения интеллектуального анализа текстов для прикладных исследований в области рекламы и связей с общественностью (анализ потребительских предпочтений, оценка репутации, мониторинг трендов и др.)
  • Рекомендательные системы.
    Постановка задачи генерации рекомендаций. Обзор классических подходов - content-based рекомендации, коллаборативная фильтрация, методы, основанные на разложении матрицы предпочтений. Реализация методов на python. Обзор библиотек машинного обучения для разработки сервисов рекомендаций.
  • Подготовка данных для предиктивных моделей.
    Отбор признаков для предиктивной модели. Разбор основных методик отбора признаков. Методы поиска аномалий в данных.
  • Коммуникационные проекты, основанные на данных.
    Презентация и обсуждение курсовых проектов.
Элементы контроля

Элементы контроля

  • неблокирующий Решение бизнес-кейса
  • неблокирующий Домашнее задание по анализу аудитории
  • неблокирующий Мини-проект: анализ рекламной кампании
  • неблокирующий Обзор источников по теме курсового проекта
    Обзор источников представляется в виде устного выступления и презентации.
  • неблокирующий Презентация плана индивидуального курсового проекта.
    Студенту необходимо представить план курсовой работы - индивидуального курсового проекта в форме мультимедийной презентации и устного выступления с последующими ответами на вопросы преподавателя и других студентов.Содержание презентации должно включать в себя:  техническое задание, цели и задачи проекта;  краткий обзор актуальных практик, анализ рынка, ситуационный анализ;  подробное описание этапов работы над проектом.
  • неблокирующий Презентация плана группового проекта.
    Проектной группе необходимо представить план группового проекта в форме мультимедийной презентации и устного выступления с последующими ответами на вопросы преподавателя и других студентов. Презентация должна включать в себя описание бизнес-задачи и её решения с помощью методов анализа данных. Оценка – общая для проектной группы.
  • неблокирующий Предзащита курсового проекта
    Студенту необходимо представить презентацию результатов курсового проекта. Выступление на 10 минут, презентация от 10 слайдов, а также ответить на вопросы преподавателя по курсовому проекту.
  • неблокирующий Домашнее задание на построение скоринговой модели
  • неблокирующий Домашнее задание по сегментации аудитории
  • неблокирующий Домашнее задание: препроцессинг данных и отбор признаков
  • неблокирующий Домашнее задание: обработка естественного языка
  • неблокирующий Домашнее задание: рекомендательная система
  • неблокирующий Домашнее задание: отчёт согласно методологии CRISP-DM
  • неблокирующий Мини-проект по коммуникациям, основанным на данных
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.075 * Домашнее задание на построение скоринговой модели + 0.075 * Домашнее задание по анализу аудитории + 0.075 * Домашнее задание по сегментации аудитории + 0.075 * Домашнее задание: обработка естественного языка + 0.05 * Домашнее задание: отчёт согласно методологии CRISP-DM + 0.075 * Домашнее задание: препроцессинг данных и отбор признаков + 0.05 * Домашнее задание: рекомендательная система + 0.075 * Мини-проект по коммуникациям, основанным на данных + 0.075 * Мини-проект: анализ рекламной кампании + 0.075 * Обзор источников по теме курсового проекта + 0.1 * Предзащита курсового проекта + 0.05 * Презентация плана группового проекта. + 0.075 * Презентация плана индивидуального курсового проекта. + 0.075 * Решение бизнес-кейса
Список литературы

Список литературы

Рекомендуемая основная литература

  • Foster, I., Ghani, R., Jarmin, R. S., Kreuter, F., & Lane, J. I. (2017). Big Data and Social Science : A Practical Guide to Methods and Tools. Boca Raton: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1353316
  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
  • King R. S. Cluster Analysis and Data Mining: An Introduction. - Mercury Learning, 2015. - ЭБС Books 24x7.
  • Malik, U., Goldwasser, M., & Johnston, B. (2019). SQL for Data Analytics : Perform Fast and Efficient Data Analysis with the Power of SQL. Packt Publishing.
  • Martin Oberhofer, Eberhard Hechler, Ivan Milman, Scott Schumacher, & Dan Wolfson. (2014). Beyond Big Data : Using Social MDM to Drive Deep Customer Insight. [N.p.]: IBM Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1600785
  • Shmueli, G., Bruce, P. C., Gedeck, P., & Patel, N. R. (2020). Data Mining for Business Analytics : Concepts, Techniques and Applications in Python. Newark: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2273611

Рекомендуемая дополнительная литература

  • Nelson, G. S. (2018). The Analytics Lifecycle Toolkit : A Practical Guide for an Effective Analytics Capability. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1727899
  • Szabó, G., & Boykin, O. (2019). Social Media Data Mining and Analytics. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1899346