2025/2026





Методы анализа больших данных в исследованиях поведения покупателей
Статус:
Маго-лего
Где читается:
Факультет компьютерных наук
Когда читается:
3, 4 модуль
Онлайн-часы:
50
Охват аудитории:
для своего кампуса
Преподаватели:
Пашков Станислав Георгиевич
Язык:
русский
Кредиты:
6
Контактные часы:
56
Программа дисциплины
Аннотация
Курс «Методы анализа больших данных в исследованиях поведения покупателей»
посвящен введению в принципы прикладного анализа фактического поведения
потребителей товаров и услуг на основе различных источников данных. Курс
предназначен для магистрантов второго года обучения и продолжает идеи/практику
курса «Автоматизированный сбор больших данных в экономико-социологических
исследованиях». Основная цель курса — показать, как набор структурированных и
неструктурированных данных помогают решать оперативные и стратегические задачи
компании в плане определения моделей и типологии поведения потребителей,
выявления целевых групп влияния/развития. Курс базируется на систематизации
знаний в следующих областях: продуктовая аналитика, методология машинного
обучения, продвинутой кластеризации и сегментации потребителей, прогнозирования
и каузация изменений во времени, программирования баз данных и аналитических
систем (дашбордов). Каждая область способствует ознакомлению с основными
задачами и решениями бизнес-вопросов, которые стоят перед аналитиками (и
социологами).
Цель освоения дисциплины
- Формирование у студентов целостной компетенции в области продуктовой аналитики поведения покупателей, сочетающей теоретическое понимание потребительского поведения с практическими навыками работы с реляционными данными, применением статистических и машинно-обучающих методов для диагностики, сегментации, прогнозирования и оценки каузальных эффектов, а также проектирования информационно-аналитических решений.
Планируемые результаты обучения
- Сформировать системное представление о продуктовой аналитике и задачах её изучения, в том числе на основе аппарата социологической и психологической теории.
- Приобрести концептуальные и практические навыки в области анализа базовых данных о потребительском поведении целевой аудитории, включая применение простых статистических тестов и методов визуальной диагностики паттернов, сравнения моделей поведения различных групп потребителей, в различных условиях.
- Освоить методы продвинутого анализа данных о потребительском поведении потребителей, включая методы машинного обучения, сегментирования целевой аудитории, а также прогнозирования изменений и исследования каузальных эффектов в зависимости от структурных и функциональных возможностей данных.
- Приобрести практические навыки конструирования и операционного взаимодействия с реляционными базами данных, построения информационно- аналитических решений (дашбордов).
Содержание учебной дисциплины
- Раздел 1: Описание курса. Введение в предмет анализа потребительского поведения и цели продуктовой аналитики.
- Раздел 2: Управление и анализ больших данных: от построения базы данных к аналитическому процессу
- Раздел 3: Анализ динамики и структуры активности пользователей (потребителей) на основе данных. Метрики активности, вовлеченности, влияния случайных событий. Формулирование гипотез.
- Раздел 4: Основные принципы юнит-экономики, монетизации активности потребителей. Введение в прогнозирование на основе эконометрики и панельного моделирования.
- Раздел 5: Сегментация потребительской аудитории.
- Раздел 6: Введение в создание и тестирование фич. Оценка полезности экспериментов в реалтайм-аналитике (real time analytics).
- Раздел 7: Введение в принципы бизнес-репортинга (business reporting). Построение аналитической панели (dashboard).
Элементы контроля
- Лабораторная работа №1В данной форме контроля слушатели выполняют серию практических упражнений для более качественной систематизации материала лекций и семинаров, что способствует расширению охвата знаний и практик. Каждая лабораторная работа посвящена конкретному разделу (разделам) курса. 1. Лабораторная работа №1: сбор, управление данными с помощью SQL + инструмента аналитики (GNU R)
- Лабораторная работа №2В данной форме контроля слушатели выполняют серию практических упражнений для более качественной систематизации материала лекций и семинаров, что способствует расширению охвата знаний и практик. Каждая лабораторная работа посвящена конкретному разделу (разделам) курса. Лабораторная работа №2: принципы прогнозного анализа (эконометрические модели, панельные регрессии)
- Лабораторная работа №3В данной форме контроля слушатели выполняют серию практических упражнений для более качественной систематизации материала лекций и семинаров, что способствует расширению охвата знаний и практик. Каждая лабораторная работа посвящена конкретному разделу (разделам) курса. Лабораторная работа №3: исследование активности и вовлеченности потребителей
- Лабораторная работа №4В данной форме контроля слушатели выполняют серию практических упражнений для более качественной систематизации материала лекций и семинаров, что способствует расширению охвата знаний и практик. Каждая лабораторная работа посвящена конкретному разделу (разделам) курса. Лабораторная работа №4: разработка, исследование, обсуждение продуктовых фич и A/B тестов
- Финальный проектФинальный проект: выполняется в мини-группах и представляет собой реализацию бизнес-кейса, где от команды требуется разработать практическую реализацию задачи в виде создания продуктовых метрик и фич, разработки рекомендаций (прототипа) по созданию информационно-аналитической панели для руководства и аналитиков
- Активность (посещаемость)Учитывается посещаемость каждого занятия
- Активность (ответы студентов на вопросы преподавателя)Учитываются ответы студентов на вопросы преподавателя
Промежуточная аттестация
- 2025/2026 4th module0.1 * Активность (ответы студентов на вопросы преподавателя) + 0.1 * Активность (посещаемость) + 0.1 * Лабораторная работа №1 + 0.15 * Лабораторная работа №2 + 0.15 * Лабораторная работа №3 + 0.15 * Лабораторная работа №4 + 0.25 * Финальный проект
Список литературы
Рекомендуемая основная литература
- Anderson, C. (2015). Creating a Data-Driven Organization : Practical Advice From the Trenches (Vol. First edition). Beijing: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1045097
- Derya Birant. (2011). Data Mining Using RFM Analysis. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.B99B7782
- Введение в статистическое обучение с примерами на языке R, Джеймс, Г., 2016
- Мастицкий, С. Э. Статистический анализ и визуализация данных с помощью R / С. Э. Мастицкий, В. К. Шитиков. — Москва : ДМК Пресс, 2015. — 496 с. — ISBN 978-5-97060-301-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/73072 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Data mining for the online retail industry: A case study of RFM model-based customer segmentation using data mining. (2012). https://doi.org/10.1057/dbm.2012.17