• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Версия для слабовидящихЛичный кабинет сотрудника ВШЭПоиск
Магистратура 2018/2019

Проектно-исследовательский семинар "Анализ данных в коммуникационных проектах"

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус: Курс обязательный (Коммуникации, основанные на данных)
Направление: 42.04.01. Реклама и связи с общественностью
Когда читается: 1-й курс, 2-4 модуль
Формат изучения: Full time
Преподаватели: Грызунова Елена Аркадьевна, Егоров Дмитрий Владимирович, Коточигов Константин Львович, Родькин Павел Евгеньевич, Суворина Татьяна Владимировна
Прогр. обучения: Коммуникации, основанные на данных
Язык: русский
Кредиты: 12

Программа дисциплины

Аннотация

Проектно-исследовательский семинар направлен на: 1) Поэтапное приобретение и усовершенствование исследовательских компетенций в области науки о данных для решения практических задач в сфере рекламы, маркетинговых коммуникаций и PR. 2) Формирование навыков управления проектами в области коммуникаций, основанных на данных. 3) Погружение в индустриальную специфику, знакомство с актуальными запросами коммуникационного рынка, получение опыта взаимодействия с заказчиками. 4) Осуществление экспертной поддержки всех форм проектной деятельности студентов в рамках образовательной программы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью дисциплины «Проектно-исследовательский семинар «Анализ данных в коммуникационных проектах» является освоение студентами аналитических и управленческих компетенций, необходимых для реализации прикладных коммуникационных проектов, основанных на данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает, как устроен рекламный рынок, и какие игроки его представляют, взаимодействие между участниками.
  • Знает, по каким метрикам бренды (компании) оценивают эффективность медиа и коммуникационных активностей.
  • Знает индикаторы эффективной коммуникации.
  • Знает современные инструменты и подходы, которые помогают рекламодателям увеличить эффективность коммуникации.
  • Знает, какие онлайн данные существуют, как собрать данные, как их использовать.
  • Знает, какие оффлайн данные существуют, как собрать данные, как их использовать.
  • Знает, как связывать разные типы данных.
  • Знает, как получить данные из открытых источников.
  • Знает принципы планирования рекламных активностей бренда.
  • Знает специфику в области обеспечения безопасности данных и существующие юридические ограничения.
  • Понимает специфику омниканальной коммуникации.
  • Имеет представление о современных тенденциях изменения потребительского поведения.
  • Дает определение методам, которые использует в работе с данными, понимает принцип работы и способы модификации для достижения определенных результатов и предлагать новые решения
  • Понимает основные направления современных научных и проектных исследований, знает, какие данные нужны, как их собрать и с помощью чего обработать для проверки гипотезы.
  • Владеет методами анализа данных для изучения аудитории, составления портрета пользователя. Владеет методами анализа данных в Python
  • Владеет методом кластеризации для анализа аудитории с помощью библиотек Python.
  • Применяет стандартные алгоритмы и методы анализа данных для решения прикладных задач для коммуникационной индустрии.
  • Представляет результаты анализа данных в формате презентации, отчета или интерактивного дэшборда ; объясняет научно-популярным языком принципы работы алгоритма, цели и задачи проекта.
  • Использует инструменты измерения и увеличения эффективности коммуникаций.
  • Понимает основные направления современных научных и проектных исследований, знает, какие данные нужны, как их собрать и с помощью чего обработать для проверки гипотезы, предлагает собственные гипотезы и составляет план проекта или научного исследования для решения своих задач.
  • Предлагает собственные гипотезы и составляет план проекта или научного исследования.
  • Знает основные направления современных научных и проектных исследований в области интеллектуального анализа текста.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Экосистема рекламного (digital) рынка и его эволюция.
    Как устроен рекламный рынок, и какие игроки его представляют, взаимодействие между участниками.
  • Тема 2. Индикаторы эффективной коммуникации.
    По каким метрикам бренды (компании) оценивают эффективность медиа и коммуникационных активностей.
  • Тема 3. Инструменты измерения эффективности.
    Обзор современных инструментов измерения эффективности маркетинговых активностей бренда.
  • Тема 4. Инструменты увеличения эффективности.
    Обзор современных инструментов и подходов, которые помогают рекламодателям увеличить эффективность коммуникации.
  • Тема 5. Онлайн данные
    Какие онлайн данные существуют, как собрать данные, как их использовать.
  • Тема 6. Оффлайн данные.
    Какие оффлайн данные существуют, как собрать данные, как их использовать.
  • Тема 7. Онлайн + Оффлайн.
    Как связывают ранее не связанные типы данных. Обзор подходов и методов. Успешные примеры.
  • Тема 8. Смежные источники данных и аналитики
    Мониторинг открытых источников и данные социальных сетей.
  • Тема 9. От медиа планирования к аудиторному планированию.
    Изменение подходов к планированию рекламных активностей бренда.
  • Тема 10. Безопасность данных.
    Безопасность данных, ограничения со стороны государства и влияние мировых рынков.
  • Тема 11. От обезличенной коммуникации к персональной.
    Решение задач кросс-девайс коммуникации и задач омниканальности.
  • Тема 12. Изменение потребительского поведения.
    Как меняется современное потребление, и какие технологии будут актуальны через 5 лет
  • Тема 13. Анализ данных для решения задач рекламодателей.
    Ключевые концепты, основные тренды, AdTech, Data Market, основные проблемы. Обзор инструментов Data science и их применения в маркетинге. Полезные ресурсы.
  • Тема 14. Первичный анализ данных.
    Выгрузка и предобработка данных (GCP, bash), демонстрация основных методов Pandas, первые попытки описания аудитории, статистические сравнения групп пользователей. Демонстрация основных методов matplotlib, seaborn, plotly.
  • Тема 15. Задачи обучения с учителем. Как построить свой Look-a-like.
    Алгоритмы классификации. Деревья решений и метод ближайших соседей. Как строится, работает, параметры и применение в реальных задачах. Линейные модели классификации и регрессии. Random Forest. Оценка эффективности алгоритмов. Построение скоринговых моделей для кук.
  • Тема 16. Обучение без учителя. Поиск групп среди аудитории сайта и построение персональной коммуникации.
    Метод главных компонент и кластеризация. Особенности применения PCA, выбор признаков, методы и метрики качества.
  • Тема 17. Другие прикладные задачи анализа данных
    Особенности задач, методы построения выводов, на что обратить внимание. Кредитный скоринг, задача оттока и анализ эффективности удержания, анализ результатов АБ теста. Кейсы.
  • Тема 18. Оценка эффективности рекламных кампаний.
    Комплексная оценка метрик, моделирование атрибуции, эвристические и мультиканальные модели, их реализация и оценка эффективности РК.
  • Тема 19. Визуализация и представление результатов.
    Как визуализировать отчет так, чтобы понравилось клиенту. Построение интерактивных дэшбордов. Обзор BI систем. Обзор возможностей визуализации данных в Google Studio и Bime. Практика визуализации данных в Tableau.
  • Тема 20. Введение в проектную работу.
    Особенности реализации коммуникационных проектов, основанных на данных: бизнес-практика, кейсы. Обсуждение выбранных студентами тем курсовых работ и групповых проектов. Требования к курсовым проектам и групповой проектной работе. Согласование графика презентаций планов курсовых работ и предзащиты групповых проектов. Презентация и обсуждение планов курсовых проектов и групповых проектов. Методология анализа данных CRISP-DM.
  • Тема 21. Построение и проверка гипотез в интеллектуальном анализе данных.
    Жизненный цикл гипотезы в интеллектуальном анализе данных. Построение гипотез. Особенности проверки гипотез при работе с большими данными. Кросс-валидация.
  • Тема 22. Интеллектуальный анализ текста.
    Предварительная обработка текстовых данных: токены, N-граммы. Тематическое моделирование. Извлечение информации и кластеризация. Байесовская классификация текстов. Анализ тональности текстов. Глубокое обучение в интеллектуальном анализе текста. Применение интеллектуального анализа текстов для прикладных исследований в области рекламы и связей с общественностью (анализ потребительских предпочтений, оценка репутации, мониторинг трендов и др.).
Элементы контроля

Элементы контроля

  • неблокирующий Оауд – оценка за активность и качество аудиторной работы.
  • неблокирующий Опроект – оценка за итоговый мини-проект второго модуля.
  • неблокирующий Одз1, Одз2, Одз3 – оценки за домашние практические задания по разделам второго модуля.
    Учащимся предлагается три практических задания по анализу аудитории и составлению статистических сравнений характеристик пользователей, построению базовых скоринговых моделей и кластеризации пользователей в виде тетрадок Jupyter, в которых требуется дописать свой код, и примерный набор данных к ним. В результате студенты получают заготовку для будущих исследований и лучше разбираются в алгоритмах подготовки данных, обучения и валидации моделей, формирования конечного результата и оценки качества алгоритма, учатся визуализировать результаты. Результатом домашней работы должна быть заполненная тетрадка Jupiter Notebook с комментариями о проделанной работе и полученными результатами.
  • неблокирующий Презентация плана курсового проекта
  • неблокирующий Предзащита группового проекта.
  • неблокирующий Предзащита курсового проекта
  • неблокирующий Устный экзамен
    Устный экзамен по билетам. В билете по 2 вопроса, имеющих одинаковый вес. Каждый вопрос оценивается по 10-балльной шкале. Округление: арифметическое.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    В диплом выставляется результирующая оценка по учебной дисциплине: Орезульт = 0,7* Онакопл + 0,3 *·Оэкз Где: Оэкз – оценка за итоговый контроль в форме устного экзамена. Накопленная оценка рассчитывается по формуле: Онакопл = 0,4 * Опромежуточная1+ 0,3 * Опромежуточная2+ 0,3 *Опромежуточная3 где: Опромежуточная1 - оценка за второй модуль Опромежуточная2 - оценка за третий модуль Опромежуточная3 - оценка за четвёртый модуль. Промежуточная оценка за второй модуль выставляется по следующей формуле: Опромежуточная1 = 0,2*Оауд. + 0,5*Опроект + 0,1* Одз1 + 0,1*Одз2 + 0,1*Одз3. Промежуточная оценка за третий модуль выставляется по следующей формуле: Опромежуточная2 = 0,4*Оауд. + 0,3*Оплан курсовой работы + 0,3 * Опредзащита группового проекта. Промежуточная оценка за четвёртый модуль выставляется по следующей формуле: Опромежуточная3 = 0,5*Оауд. + 0,5*Опредзащита курсовой работы.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Foster, I., Ghani, R., Jarmin, R. S., Kreuter, F., & Lane, J. I. (2017). Big Data and Social Science : A Practical Guide to Methods and Tools. Boca Raton: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1353316
  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.

Рекомендуемая дополнительная литература

  • Martin Oberhofer, Eberhard Hechler, Ivan Milman, Scott Schumacher, & Dan Wolfson. (2014). Beyond Big Data : Using Social MDM to Drive Deep Customer Insight. [N.p.]: IBM Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1600785