Как предиктивная аналитика помогает сохранить клиентов и повысить продажи

«Биглион» — агрегатор скидок на различные товары и услуги в России, на сегодняшний день — крупнейший в России. Ежемесячный трафик сайта вместе с мобильными приложениями — от 4,5 до 6 миллионов человек. Есть фактор сезонности с ростом внимания к скидкам в феврале и марте. При этом особого летнего падения нет. За месяц пользователи «Биглион» покупают свыше 400 000 купонов из примерно 7000 предложений. В среднем, каждое предложение доступно в течение месяца.

Аналитика и рекомендации

Сегментация пользователей по LTV (lifetime value — жизненный цикл) в ретроспективе 12–24 месяцев даёт понимание, кто важен с точки зрения генерации дохода. С одной стороны, необходимо удерживать наиболее доходные сегменты, с другой — подтягивать дополнительные покупки через кросс- и апсейл.

Для решения первой задачи вы должны в режиме реального времени понимать, какова вероятность ухода каждого пользователя, а кто недавно делал покупки. Для второй — сделать каждому пользователю предложение, конверсия которого будет заведомо выше, чем в случае, когда он искал что-либо самостоятельно.

Продвижение медцентров и клиник: три кейса о SEO, TikTok и Instagram*

Как получить измеримые результаты в фарммаркетинге.

Показываем на примерах →

Спецпроект

Поэтому мы собрали данные по пользовательскому поведению и разработали две вещи: предиктивную аналитику (ПА) для предсказания вероятности оттока пользователя по его текущим действиям и рекомендательную систему, которая должна выдавать рекомендации с конверсией выше, чем у внешних отраслевых решений.

Как анализировали раньше

Грубо говоря, есть три этапа развития аналитики. Первый — хаос статистик, второй — унификация и сбор данных в рамках единого подхода, третий — предиктивная аналитика.

До предиктивной модели мы не могли сказать, с какой вероятностью пользователь может уйти в ближайшие несколько месяцев. Если же вы знаете, что пользователи, которые генерировали вам 10% дохода за последние 24 месяца, с вероятностью 85% и выше уйдут, то — как минимум! — можете направить на них продуктовые коммуникации, чтобы их удержать. Например, email, push-нотификации, сообщения в личном кабинете, промокод.

До того как началось использование алгоритма рекомендательной системы, пользователю показывались релевантные предложения согласно общей логике работы ecommerce-сайтов. Есть решения отраслевого характера, которые находят в большой массе пользовательских действий логику — купил это, значит, нужно рекомендовать тот товар. Как правило, их конверсия удовлетворяет ecommerce-игроков в силу высокого среднего чека и других причин.

Логика товарных категорий

Наша специфика в том, что мы предлагаем услуги, которые могут покупаться с высокой частотностью. И все эти услуги разные. Если пользователь купил пальто и платья, потом ему рекомендовали сумочку и туфли — их он также купит с довольно высокой вероятностью. Посещение салона красоты и спа — примерно раз в неделю, поход в ресторан или на квест с друзьями — три–четыре раза в месяц. А вот тур покупают один–три раза в год.

У каждой категории есть своя специфика и частота покупок, она отличается в «логике машины», у них разные средние чеки и поведение пользователя.

С технической точки зрения это реализовывалось так: мы собрали истории пользовательских покупок и действий и аккумулировали их в одном месте. Получилась матрица: уникальный пользователь и все его действия (заходы, просмотры витрин, покупки, категории, средний чек, время покупки, частота, уходы с витрин без покупки и так далее). Мы знали одну вещь: пользователи приходят на сайт, регистрируются, покупают и уходят, и чем сильнее ты снижаешь отток, тем больше зарабатываешь.

Для любого бизнеса customer retention is king. Если можешь предсказывать отток, значит, уже есть над чем работать.

Как построили предиктивную аналитику

За 7 лет работы компании мы накопили данные о 4 миллионах уникальных покупателей, по каждому — в среднем 200 событий (просмотры страницы, витрин, транзакции, категории покупок, сумма). Эти 800 миллионов событий мы обработали, выявив ряд первичных событий, плюс так называемые вторичные события и признаки (образованные по логике «если то, то это» — грубо говоря, перемножение первичных данных).

При запуске обеих моделей (анализ оттока пользователей и рекомендательная система) мы использовали алгоритм random forest.

Что такое random forest

Поведение пользователя — цепь последовательных действий от намерения купить до самой покупки. Алгоритм умеет обобщать логику шагов и делать вывод о вероятности действия, он обучаем (с учётом того, что действия и предпочтения пользователей меняются), плюс хорошо впитывает вторичные данные (признаки и события по каждому пользователю). Этот алгоритм методологически подходит к решению нашей задачи.

Random forest превращает нелинейную структуру данных в линейную — но более высокого порядка

Как обучали алгоритм

Сначала — сбор, систематизация данных для обучения модели и очистка полученных данных. Далее — построение первой версии и первичное обучение, валидация модели. Пара итераций, чтобы сделать версию работающей. После этого — проверка.

По оттоку мы смотрели, правильно ли алгоритм предсказывает уход, по рекомендательной системе — улучшилась ли конверсия в покупках.

Результаты внедрения алгоритмов

После внедрения новой модели мы стали предсказывать вероятность оттока пользователей с 99,5% точностью (с отсечкой в 75%+, 85%+, 95%+). Фактически по каждому профилю (ID пользователя внутри системы) в режиме реального времени мы можем проследить, растёт ли вероятность его ухода. Соответственно, если это высокодоходная когорта или когорта со средним доходом, удержание таких пользователей — реальный драйвер роста нашего дохода.

О рекомендательной системе: включив самообучающийся анализ на основе 15+ миллионов покупок, мы обнаружили, что система действительно рекомендует предложения, которые лучше покупаются, причём многие комбинации не поддаются обычной логике. Кому-то поход в SPA нужен не после макияжа или парикмахерской, а после ужина в ресторане средиземноморской кухни или полёта на воздушном шаре.

Система учится, понимая частоту покупок, микс категорий и подкатегорий, сезонность, траекторию поведения сегментов пользователей внутри жизненного цикла. В этом сила машинного обучения.

Что это дало компании

Чёткое и подтверждённое данными понимание: если удерживать пользователей эффективно, потенциально можно удвоить доход. Сегодня мы кардинально перестраиваем коммуникации с пользователем: это и почтовый маркетинг, и push-нотификации, и само взаимодействие с контакт-центром, вопросы качества, измерение NPS по категориям. Нам стало ясно, кого нужно удерживать прежде всего и когда начинать это делать (спойлер: как можно раньше!).

Приведу пример из другой вертикали: если пользователь не был в рейтинговом сервисе 14 дней, возврат вероятен, 30 дней — его очень трудно вернуть, 90 — почти невозможно.

Рекомендательную систему пока используем в качестве прототипа, но совсем скоро внедрим во всём продукте, вместе с новыми версиями сайта и приложений. Но уже сейчас мы доказали, что можно зарабатывать дополнительные 10% (а при более эффективной интеграции с email и push-нотификациями — до 20%).

И самое главное: применять предиктивную аналитику можно практически в любом сегменте, где есть массовые продажи.