Что такое предиктивная сегментация

Классическая сегментация группирует пользователей по тому, что уже произошло: демография, история покупок, поведение на сайте. Предиктивная сегментация использует ML, чтобы ответить на другой вопрос: что этот пользователь сделает в ближайшее время?

На практике это означает три типа прогнозов:

Прогноз Вопрос Сценарий применения
Churn prediction Уйдёт ли пользователь в ближайшие 30–60 дней? Win-back кампания до ухода
Purchase probability Купит ли в ближайшие 7–14 дней? Горячие лиды для акций
LTV prediction Каков ожидаемый доход с пользователя за год? Приоритизация VIP-сегмента

Churn prediction: как работает модель

Модель churn prediction анализирует паттерны поведения пользователей, которые в прошлом ушли, и ищет схожие паттерны у активных:

  • Снижение частоты визитов (раньше 4×/неделю, теперь 1×/месяц)
  • Сокращение глубины сессий
  • Прекращение взаимодействия с рекомендациями
  • Снижение суммы заказов или переключение на более дешёвый сегмент

На выходе — скор от 0 до 1 для каждого пользователя. Пользователи с высоким скором (например, >0.7) попадают в сегмент риска.

Важно: предиктивная модель — вероятностная, не детерминированная. Пользователь в сегменте «высокий риск» — не тот, кто точно уйдёт, а тот, для кого статистически оправдано превентивное вмешательство.

Как использовать предиктивные сегменты

Churn-сегмент: запустить персонализированную win-back кампанию с фокусом на товары из категорий с высоким аффинити пользователя, а не на общие промо. Цель — вернуть вовлечённость, пока интерес не пропал полностью.

High purchase probability: сфокусировать ресурс персонализации на «горячих» пользователях. Показать им точные рекомендации, а не бонусные предложения — они и так близки к покупке.

High LTV prediction: выделить будущих VIP-клиентов на ранней стадии и инвестировать в их удержание непропорционально больше, чем в среднестатистического покупателя.

Требования к данным

Предиктивные модели требуют достаточного объёма исторических данных:

  • Минимум 6–12 месяцев транзакционной истории
  • Поведенческие события (сессии, просмотры, клики)
  • База от 10–20 тыс. пользователей с транзакциями для надёжной модели
  • Регулярное переобучение — паттерны поведения меняются (сезонность, рыночные тренды)