• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ больших данных в экономико-социологических исследованиях

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты
Статус:
Курс по выбору
Когда читается:
2-й курс, 1, 2 модуль

Преподаватель

Программа дисциплины

Аннотация

Курс “Анализ больших данных в экономико-социологических исследованиях” предназначен для магистрантов второго года обучения и продолжает идеи и практики курса “Автоматизированный сбор больших данных в экономико-социологических исследованиях”. В курсе рассматриваются основные задачи продуктовой аналитики в IT-сфере, использующие идеи и методы больших данных. Слушатели курса ознакомятся с основными ролями и компетенциями аналитиков в IT-компаниях, научатся отвечать с помощью данных на ключевые бизнес-вопросы, стоящие перед аналитиками. Также слушатели познакомятся с возможностями применения методов машинного обучения для повышения ценности продукта - сегментации пользователей по их платежному поведению, прогнозирование оттока, прогностическая оценка окупаемости рекламных кампаний и т.д.
Цель освоения дисциплины

Цель освоения дисциплины

  • Дать студентам представление об основных задачах и инструментах, стоящих перед аналитиками в современных бизнес-компаниях.
  • Показать студентам возможные перспективы профессионального развития и заложить необходимые базовые навыки.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студенты понимают цели и задачи, которые стоят перед аналитиками в бизнес-компаниях, преимущественно IT-сферы.
  • Студенты знают разные метрики активности и вовлечения пользователей, понимают их разницу, способны высчитать метрики или нарисовать соответствующие графики.
  • Студенты понимают, как высчитываются монетизационные показатели проекта, способны различать различные модели монетизации, могут оценить и проинтерпретировать lifetime value пользователя.
  • Студенты понимают, как проводить АБ-тесты для новых элементов продукта: способны написать дизайн исследования, расчитать выборку и проинтрпертировать результаты.
  • Студенты понимают основные модели привлечения пользователей продукта через рекламные кампании, способны оценивать и предсказывать эффективность рекламных кампаний.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в цели и задачи продуктовой аналитики
    Лекция: Направления деятельности аналитиков: веб-аналитика, маркетинговая аналитика, продуктовая аналитика, анализ данных и машинное обучение. Основные задачи продуктовых аналитиков. Процессы и роль аналитика в продукте. Жизненный цикл продукта. Роль аналитиков на каждой этапе.
  • Метрики активности и вовлечения пользователей
    Лекция: Оценка активности пользователей - DAU, MAU. Методы оценки удержания (retention) и оттока (churn), проблема операционализации оттока. Rolling retention, недостатки метода. Retention rate. Основные ошибки при оценке удержания. Практикумы: Подключение к базам данных. PostgreSQL, основы языка SQL. Визуализация и интерпретация DAU/MAU, значений удержания. Предсказание оттока пользователей: конструирование и отбор переменных, преобразование шкал. Качество прогностической модели.
  • Основы юнит-экономики и метрики монетизации пользователей
    Лекция: Что такое юнит-экономика. Конверсия в целевое действие, скорость конверсии. ARPU, ARPPU, ARPDAU, структура прибыли. ROI. Основные ошибки при вычислении монетизационных метрик. Lifetime value (LTV), модели Pareto/NBD, BG/NBD, BG/BB. RFM-анализ. Понятие бизнес-модели. Практикумы: Вычисление значений конверсии. Расчет LTV. Продуктовые выводы и рекомендации на основе монетизационных метрик. Предсказание классов платящих и неплатящих пользователей. Деревья решений, случайный лес. PMML-спецификация.
  • Создание и тестирование фич (feature).
    Лекции: Понятие фичи в разработке IT-продуктов. Понятие Unique selling proposition (USP). Задачи аналитиков при разработке фич. A/Б-тесты. Парадигмы A/Б-тестов (частотные тесты, sequential-подход, многорукие бандиты). Частые ошибки в тестировании. Размер выборки. Практикумы: Анализ ключевых фич популярных it-продуктов (Яндекс.Музыка, Авито, Twitter, Aviasales, или другие продукты на выбор студентов). Обсуждение возможных новых фич. Постановка гипотезы и построение дизайна А/Б-теста новой фичи. Определение размера выборки. Анализ и интерпретация результатов теста.
  • Основы маркетинговой аналитики
    Исследования рынка. Модели привлечения пользователей в IT-продукты. Рекламные площадки (Facebook Ads, Google Adwords, прочие.). Проблема атрибуции. Оценка эффективности рекламных кампаний, бенчмарки. Практикумы: Кривые LTV. Оценка окупаемости кампании на 90 день, прогнозирование с помощью линейных моделей.
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа 1
    Работа сдается в виде скрипта на R (Python или другой ЯП - по договоренности со студентом)
  • неблокирующий Домашнее задание 1
    Работа сдается в виде R-markdown-файла (или же любой другой формат, предполагающий использование языков программирования, по договоренности со студентом).
  • неблокирующий Контрольная работа 2
    Работа сдается в виде скрипта на R (Python или другой ЯП - по договоренности со студентом)
  • неблокирующий Домашнее задание 2
    Работа сдается в виде R-markdown-файла (или же любой другой формат, предполагающий использование языков программирования, по договоренности со студентом).
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.25 * Домашнее задание 1 + 0.25 * Домашнее задание 2 + 0.25 * Контрольная работа 1 + 0.25 * Контрольная работа 2
Список литературы

Список литературы

Рекомендуемая основная литература

  • - Джеймс Г., Уиттон Д., Хасти Т. — Введение в статистическое обучение с примерами на языке R - Издательство "ДМК Пресс" - 2017 - ISBN: 978-5-97060-495-3 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/93580
  • Derya Birant. (2011). Data Mining Using RFM Analysis. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.B99B7782

Рекомендуемая дополнительная литература

  • - Груздев А.В. — Прогнозное моделирование в IBM SPSS Statistics, R и Python: метод деревьев решений и случайный лес - Издательство "ДМК Пресс" - 2018 - ISBN: 978-5-97060-539-4 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/123700
  • - Гудфеллоу Я., Бенджио И., Курвилль А. — Глубокое обучение - Издательство "ДМК Пресс" - 2018 - ISBN: 978-5-97060-618-6 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/107901
  • - Джеффри М. — Маркетинг, основанный на данных. 15 показателей, которые должен знать каждый - Издательство "Манн, Иванов и Фербер" - 2013 - ISBN: 978-5-91657-666-5 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/62237
  • Anderson, C. (2015). Creating a Data-Driven Organization : Practical Advice From the Trenches (Vol. First edition). Beijing: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1045097
  • Data mining for the online retail industry: A case study of RFM model-based customer segmentation using data mining. (2012). https://doi.org/10.1057/dbm.2012.17