Магистратура
2018/2019
Проектно-исследовательский семинар "Анализ данных в коммуникационных проектах"
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс обязательный (Коммуникации, основанные на данных)
Направление:
42.04.01. Реклама и связи с общественностью
Кто читает:
Школа коммуникаций
Где читается:
Факультет креативных индустрий
Когда читается:
1-й курс, 2-4 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Грызунова Елена Аркадьевна,
Егоров Дмитрий Владимирович,
Коточигов Константин Львович,
Родькин Павел Евгеньевич,
Суворина Татьяна Владимировна
Прогр. обучения:
Коммуникации, основанные на данных
Язык:
русский
Кредиты:
12
Контактные часы:
144
Программа дисциплины
Аннотация
Проектно-исследовательский семинар направлен на: 1) Поэтапное приобретение и усовершенствование исследовательских компетенций в области науки о данных для решения практических задач в сфере рекламы, маркетинговых коммуникаций и PR. 2) Формирование навыков управления проектами в области коммуникаций, основанных на данных. 3) Погружение в индустриальную специфику, знакомство с актуальными запросами коммуникационного рынка, получение опыта взаимодействия с заказчиками. 4) Осуществление экспертной поддержки всех форм проектной деятельности студентов в рамках образовательной программы.
Цель освоения дисциплины
- Целью дисциплины «Проектно-исследовательский семинар «Анализ данных в коммуникационных проектах» является освоение студентами аналитических и управленческих компетенций, необходимых для реализации прикладных коммуникационных проектов, основанных на данных.
Планируемые результаты обучения
- Знает, как устроен рекламный рынок, и какие игроки его представляют, взаимодействие между участниками.
- Знает, по каким метрикам бренды (компании) оценивают эффективность медиа и коммуникационных активностей.
- Знает индикаторы эффективной коммуникации.
- Знает современные инструменты и подходы, которые помогают рекламодателям увеличить эффективность коммуникации.
- Знает, какие онлайн данные существуют, как собрать данные, как их использовать.
- Знает, какие оффлайн данные существуют, как собрать данные, как их использовать.
- Знает, как связывать разные типы данных.
- Знает, как получить данные из открытых источников.
- Знает принципы планирования рекламных активностей бренда.
- Знает специфику в области обеспечения безопасности данных и существующие юридические ограничения.
- Понимает специфику омниканальной коммуникации.
- Имеет представление о современных тенденциях изменения потребительского поведения.
- Дает определение методам, которые использует в работе с данными, понимает принцип работы и способы модификации для достижения определенных результатов и предлагать новые решения
- Понимает основные направления современных научных и проектных исследований, знает, какие данные нужны, как их собрать и с помощью чего обработать для проверки гипотезы.
- Владеет методами анализа данных для изучения аудитории, составления портрета пользователя. Владеет методами анализа данных в Python
- Владеет методом кластеризации для анализа аудитории с помощью библиотек Python.
- Применяет стандартные алгоритмы и методы анализа данных для решения прикладных задач для коммуникационной индустрии.
- Представляет результаты анализа данных в формате презентации, отчета или интерактивного дэшборда ; объясняет научно-популярным языком принципы работы алгоритма, цели и задачи проекта.
- Использует инструменты измерения и увеличения эффективности коммуникаций.
- Понимает основные направления современных научных и проектных исследований, знает, какие данные нужны, как их собрать и с помощью чего обработать для проверки гипотезы, предлагает собственные гипотезы и составляет план проекта или научного исследования для решения своих задач.
- Предлагает собственные гипотезы и составляет план проекта или научного исследования.
- Знает основные направления современных научных и проектных исследований в области интеллектуального анализа текста.
Содержание учебной дисциплины
- Тема 1. Экосистема рекламного (digital) рынка и его эволюция.Как устроен рекламный рынок, и какие игроки его представляют, взаимодействие между участниками.
- Тема 2. Индикаторы эффективной коммуникации.По каким метрикам бренды (компании) оценивают эффективность медиа и коммуникационных активностей.
- Тема 3. Инструменты измерения эффективности.Обзор современных инструментов измерения эффективности маркетинговых активностей бренда.
- Тема 5. Онлайн данныеКакие онлайн данные существуют, как собрать данные, как их использовать.
- Тема 4. Инструменты увеличения эффективности.Обзор современных инструментов и подходов, которые помогают рекламодателям увеличить эффективность коммуникации.
- Тема 6. Оффлайн данные.Какие оффлайн данные существуют, как собрать данные, как их использовать.
- Тема 7. Онлайн + Оффлайн.Как связывают ранее не связанные типы данных. Обзор подходов и методов. Успешные примеры.
- Тема 8. Смежные источники данных и аналитикиМониторинг открытых источников и данные социальных сетей.
- Тема 10. Безопасность данных.Безопасность данных, ограничения со стороны государства и влияние мировых рынков.
- Тема 9. От медиа планирования к аудиторному планированию.Изменение подходов к планированию рекламных активностей бренда.
- Тема 11. От обезличенной коммуникации к персональной.Решение задач кросс-девайс коммуникации и задач омниканальности.
- Тема 12. Изменение потребительского поведения.Как меняется современное потребление, и какие технологии будут актуальны через 5 лет
- Тема 13. Анализ данных для решения задач рекламодателей.Ключевые концепты, основные тренды, AdTech, Data Market, основные проблемы. Обзор инструментов Data science и их применения в маркетинге. Полезные ресурсы.
- Тема 14. Первичный анализ данных.Выгрузка и предобработка данных (GCP, bash), демонстрация основных методов Pandas, первые попытки описания аудитории, статистические сравнения групп пользователей. Демонстрация основных методов matplotlib, seaborn, plotly.
- Тема 15. Задачи обучения с учителем. Как построить свой Look-a-like.Алгоритмы классификации. Деревья решений и метод ближайших соседей. Как строится, работает, параметры и применение в реальных задачах. Линейные модели классификации и регрессии. Random Forest. Оценка эффективности алгоритмов. Построение скоринговых моделей для кук.
- Тема 16. Обучение без учителя. Поиск групп среди аудитории сайта и построение персональной коммуникации.Метод главных компонент и кластеризация. Особенности применения PCA, выбор признаков, методы и метрики качества.
- Тема 17. Другие прикладные задачи анализа данныхОсобенности задач, методы построения выводов, на что обратить внимание. Кредитный скоринг, задача оттока и анализ эффективности удержания, анализ результатов АБ теста. Кейсы.
- Визуализация и представление результатов.Как визуализировать отчет так, чтобы понравилось клиенту. Построение интерактивных дэшбордов. Обзор BI систем. Обзор возможностей визуализации данных в Google Studio. Практика визуализации данных в Tableau. Оформление результатов и презентация заказчику.
- Тема 20. Введение в проектную работу.Особенности реализации коммуникационных проектов, основанных на данных: бизнес-практика, кейсы. Обсуждение выбранных студентами тем курсовых работ и групповых проектов. Требования к курсовым проектам и групповой проектной работе. Согласование графика презентаций планов курсовых работ и предзащиты групповых проектов. Презентация и обсуждение планов курсовых проектов и групповых проектов. Методология анализа данных CRISP-DM.
- Тема 21. Построение и проверка гипотез в интеллектуальном анализе данных.Жизненный цикл гипотезы в интеллектуальном анализе данных. Построение гипотез. Особенности проверки гипотез при работе с большими данными. Кросс-валидация.
- Тема 22. Интеллектуальный анализ текста.Предварительная обработка текстовых данных: токены, N-граммы. Тематическое моделирование. Извлечение информации и кластеризация. Байесовская классификация текстов. Анализ тональности текстов. Глубокое обучение в интеллектуальном анализе текста. Применение интеллектуального анализа текстов для прикладных исследований в области рекламы и связей с общественностью (анализ потребительских предпочтений, оценка репутации, мониторинг трендов и др.).
- Оценка эффективности рекламных кампаний.Комплексная оценка метрик, моделирование атрибуции, эвристические и мультиканальные модели, их реализация и оценка эффективности РК.
Элементы контроля
- Оауд – оценка за активность и качество аудиторной работы.
- Опроект – оценка за итоговый мини-проект второго модуля.
- Одз1, Одз2, Одз3 – оценки за домашние практические задания по разделам второго модуля.Учащимся предлагается три практических задания по анализу аудитории и составлению статистических сравнений характеристик пользователей, построению базовых скоринговых моделей и кластеризации пользователей в виде тетрадок Jupyter, в которых требуется дописать свой код, и примерный набор данных к ним. В результате студенты получают заготовку для будущих исследований и лучше разбираются в алгоритмах подготовки данных, обучения и валидации моделей, формирования конечного результата и оценки качества алгоритма, учатся визуализировать результаты. Результатом домашней работы должна быть заполненная тетрадка Jupiter Notebook с комментариями о проделанной работе и полученными результатами.
- Презентация плана курсового проекта
- Предзащита группового проекта.
- Предзащита курсового проекта
- Устный экзаменУстный экзамен по билетам. В билете по 2 вопроса, имеющих одинаковый вес. Каждый вопрос оценивается по 10-балльной шкале. Округление: арифметическое.
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)В диплом выставляется результирующая оценка по учебной дисциплине: Орезульт = 0,7* Онакопл + 0,3 *·Оэкз Где: Оэкз – оценка за итоговый контроль в форме устного экзамена. Накопленная оценка рассчитывается по формуле: Онакопл = 0,4 * Опромежуточная1+ 0,3 * Опромежуточная2+ 0,3 *Опромежуточная3 где: Опромежуточная1 - оценка за второй модуль Опромежуточная2 - оценка за третий модуль Опромежуточная3 - оценка за четвёртый модуль. Промежуточная оценка за второй модуль выставляется по следующей формуле: Опромежуточная1 = 0,2*Оауд. + 0,5*Опроект + 0,1* Одз1 + 0,1*Одз2 + 0,1*Одз3. Промежуточная оценка за третий модуль выставляется по следующей формуле: Опромежуточная2 = 0,4*Оауд. + 0,3*Оплан курсовой работы + 0,3 * Опредзащита группового проекта. Промежуточная оценка за четвёртый модуль выставляется по следующей формуле: Опромежуточная3 = 0,5*Оауд. + 0,5*Опредзащита курсовой работы.
Список литературы
Рекомендуемая основная литература
- Foster, I., Ghani, R., Jarmin, R. S., Kreuter, F., & Lane, J. I. (2017). Big Data and Social Science : A Practical Guide to Methods and Tools. Boca Raton: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1353316
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
Рекомендуемая дополнительная литература
- Martin Oberhofer, Eberhard Hechler, Ivan Milman, Scott Schumacher, & Dan Wolfson. (2014). Beyond Big Data : Using Social MDM to Drive Deep Customer Insight. [N.p.]: IBM Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1600785