Что такое предиктивная сегментация
Классическая сегментация группирует пользователей по тому, что уже произошло: демография, история покупок, поведение на сайте. Предиктивная сегментация использует ML, чтобы ответить на другой вопрос: что этот пользователь сделает в ближайшее время?
На практике это означает три типа прогнозов:
| Прогноз | Вопрос | Сценарий применения |
|---|---|---|
| Churn prediction | Уйдёт ли пользователь в ближайшие 30–60 дней? | Win-back кампания до ухода |
| Purchase probability | Купит ли в ближайшие 7–14 дней? | Горячие лиды для акций |
| LTV prediction | Каков ожидаемый доход с пользователя за год? | Приоритизация VIP-сегмента |
Churn prediction: как работает модель
Модель churn prediction анализирует паттерны поведения пользователей, которые в прошлом ушли, и ищет схожие паттерны у активных:
- Снижение частоты визитов (раньше 4×/неделю, теперь 1×/месяц)
- Сокращение глубины сессий
- Прекращение взаимодействия с рекомендациями
- Снижение суммы заказов или переключение на более дешёвый сегмент
На выходе — скор от 0 до 1 для каждого пользователя. Пользователи с высоким скором (например, >0.7) попадают в сегмент риска.
Важно: предиктивная модель — вероятностная, не детерминированная. Пользователь в сегменте «высокий риск» — не тот, кто точно уйдёт, а тот, для кого статистически оправдано превентивное вмешательство.
Как использовать предиктивные сегменты
Churn-сегмент: запустить персонализированную win-back кампанию с фокусом на товары из категорий с высоким аффинити пользователя, а не на общие промо. Цель — вернуть вовлечённость, пока интерес не пропал полностью.
High purchase probability: сфокусировать ресурс персонализации на «горячих» пользователях. Показать им точные рекомендации, а не бонусные предложения — они и так близки к покупке.
High LTV prediction: выделить будущих VIP-клиентов на ранней стадии и инвестировать в их удержание непропорционально больше, чем в среднестатистического покупателя.
Требования к данным
Предиктивные модели требуют достаточного объёма исторических данных:
- Минимум 6–12 месяцев транзакционной истории
- Поведенческие события (сессии, просмотры, клики)
- База от 10–20 тыс. пользователей с транзакциями для надёжной модели
- Регулярное переобучение — паттерны поведения меняются (сезонность, рыночные тренды)