«Биглион» — агрегатор скидок на различные товары и услуги в России, на сегодняшний день — крупнейший в России. Ежемесячный трафик сайта вместе с мобильными приложениями — от 4,5 до 6 миллионов человек. Есть фактор сезонности с ростом внимания к скидкам в феврале и марте. При этом особого летнего падения нет. За месяц пользователи «Биглион» покупают свыше 400 000 купонов из примерно 7000 предложений. В среднем, каждое предложение доступно в течение месяца.
Аналитика и рекомендации
Сегментация пользователей по LTV (lifetime value — жизненный цикл) в ретроспективе 12–24 месяцев даёт понимание, кто важен с точки зрения генерации дохода. С одной стороны, необходимо удерживать наиболее доходные сегменты, с другой — подтягивать дополнительные покупки через кросс- и апсейл.
Для решения первой задачи вы должны в режиме реального времени понимать, какова вероятность ухода каждого пользователя, а кто недавно делал покупки. Для второй — сделать каждому пользователю предложение, конверсия которого будет заведомо выше, чем в случае, когда он искал что-либо самостоятельно.
Продвижение медцентров и клиник: три кейса о SEO, TikTok и Instagram*
Как получить измеримые результаты в фарммаркетинге.
Показываем на примерах →
Спецпроект
Поэтому мы собрали данные по пользовательскому поведению и разработали две вещи: предиктивную аналитику (ПА) для предсказания вероятности оттока пользователя по его текущим действиям и рекомендательную систему, которая должна выдавать рекомендации с конверсией выше, чем у внешних отраслевых решений.
Как анализировали раньше
Грубо говоря, есть три этапа развития аналитики. Первый — хаос статистик, второй — унификация и сбор данных в рамках единого подхода, третий — предиктивная аналитика.
До предиктивной модели мы не могли сказать, с какой вероятностью пользователь может уйти в ближайшие несколько месяцев. Если же вы знаете, что пользователи, которые генерировали вам 10% дохода за последние 24 месяца, с вероятностью 85% и выше уйдут, то — как минимум! — можете направить на них продуктовые коммуникации, чтобы их удержать. Например, email, push-нотификации, сообщения в личном кабинете, промокод.
До того как началось использование алгоритма рекомендательной системы, пользователю показывались релевантные предложения согласно общей логике работы ecommerce-сайтов. Есть решения отраслевого характера, которые находят в большой массе пользовательских действий логику — купил это, значит, нужно рекомендовать тот товар. Как правило, их конверсия удовлетворяет ecommerce-игроков в силу высокого среднего чека и других причин.
Логика товарных категорий
Наша специфика в том, что мы предлагаем услуги, которые могут покупаться с высокой частотностью. И все эти услуги разные. Если пользователь купил пальто и платья, потом ему рекомендовали сумочку и туфли — их он также купит с довольно высокой вероятностью. Посещение салона красоты и спа — примерно раз в неделю, поход в ресторан или на квест с друзьями — три–четыре раза в месяц. А вот тур покупают один–три раза в год.
У каждой категории есть своя специфика и частота покупок, она отличается в «логике машины», у них разные средние чеки и поведение пользователя.
С технической точки зрения это реализовывалось так: мы собрали истории пользовательских покупок и действий и аккумулировали их в одном месте. Получилась матрица: уникальный пользователь и все его действия (заходы, просмотры витрин, покупки, категории, средний чек, время покупки, частота, уходы с витрин без покупки и так далее). Мы знали одну вещь: пользователи приходят на сайт, регистрируются, покупают и уходят, и чем сильнее ты снижаешь отток, тем больше зарабатываешь.
Для любого бизнеса customer retention is king. Если можешь предсказывать отток, значит, уже есть над чем работать.
Как построили предиктивную аналитику
За 7 лет работы компании мы накопили данные о 4 миллионах уникальных покупателей, по каждому — в среднем 200 событий (просмотры страницы, витрин, транзакции, категории покупок, сумма). Эти 800 миллионов событий мы обработали, выявив ряд первичных событий, плюс так называемые вторичные события и признаки (образованные по логике «если то, то это» — грубо говоря, перемножение первичных данных).
При запуске обеих моделей (анализ оттока пользователей и рекомендательная система) мы использовали алгоритм random forest.
Что такое random forest
Поведение пользователя — цепь последовательных действий от намерения купить до самой покупки. Алгоритм умеет обобщать логику шагов и делать вывод о вероятности действия, он обучаем (с учётом того, что действия и предпочтения пользователей меняются), плюс хорошо впитывает вторичные данные (признаки и события по каждому пользователю). Этот алгоритм методологически подходит к решению нашей задачи.
Как обучали алгоритм
Сначала — сбор, систематизация данных для обучения модели и очистка полученных данных. Далее — построение первой версии и первичное обучение, валидация модели. Пара итераций, чтобы сделать версию работающей. После этого — проверка.
По оттоку мы смотрели, правильно ли алгоритм предсказывает уход, по рекомендательной системе — улучшилась ли конверсия в покупках.
Результаты внедрения алгоритмов
После внедрения новой модели мы стали предсказывать вероятность оттока пользователей с 99,5% точностью (с отсечкой в 75%+, 85%+, 95%+). Фактически по каждому профилю (ID пользователя внутри системы) в режиме реального времени мы можем проследить, растёт ли вероятность его ухода. Соответственно, если это высокодоходная когорта или когорта со средним доходом, удержание таких пользователей — реальный драйвер роста нашего дохода.
О рекомендательной системе: включив самообучающийся анализ на основе 15+ миллионов покупок, мы обнаружили, что система действительно рекомендует предложения, которые лучше покупаются, причём многие комбинации не поддаются обычной логике. Кому-то поход в SPA нужен не после макияжа или парикмахерской, а после ужина в ресторане средиземноморской кухни или полёта на воздушном шаре.
Система учится, понимая частоту покупок, микс категорий и подкатегорий, сезонность, траекторию поведения сегментов пользователей внутри жизненного цикла. В этом сила машинного обучения.
Что это дало компании
Чёткое и подтверждённое данными понимание: если удерживать пользователей эффективно, потенциально можно удвоить доход. Сегодня мы кардинально перестраиваем коммуникации с пользователем: это и почтовый маркетинг, и push-нотификации, и само взаимодействие с контакт-центром, вопросы качества, измерение NPS по категориям. Нам стало ясно, кого нужно удерживать прежде всего и когда начинать это делать (спойлер: как можно раньше!).
Приведу пример из другой вертикали: если пользователь не был в рейтинговом сервисе 14 дней, возврат вероятен, 30 дней — его очень трудно вернуть, 90 — почти невозможно.
Рекомендательную систему пока используем в качестве прототипа, но совсем скоро внедрим во всём продукте, вместе с новыми версиями сайта и приложений. Но уже сейчас мы доказали, что можно зарабатывать дополнительные 10% (а при более эффективной интеграции с email и push-нотификациями — до 20%).
И самое главное: применять предиктивную аналитику можно практически в любом сегменте, где есть массовые продажи.
Читайте также:
- Машинное обучение: что такое и почему на слуху
- Как мы с помощью предиктивных моделей сэкономили 20% бюджета на продвижение мобильных игр
- Большие данные и машинное обучение в ритейле: интервью с директором по онлайн-маркетингу OZON
Мнение редакции может не совпадать с мнением автора. Ваши статьи присылайте нам на 42@cossa.ru. А наши требования к ним — вот тут.
Источник: