🤖 AI / ML

Переранжирование

Reranking · re-ranking · reranking · дополнительное ранжирование

Определение

Переранжирование — этап конвейера рекомендаций или поиска, на котором предварительно отобранные кандидаты переупорядочиваются более точной моделью с учётом контекста пользователя, бизнес-правил и дополнительных признаков.

Два этапа рекомендательного конвейера

Рекомендательная система в масштабах крупного e-commerce не может применять тяжёлую персонализированную модель ко всем миллионам товаров каталога — это слишком долго. Поэтому конвейер делится на два этапа:

Candidate retrieval (первичная выборка) — быстро отбирает сотни кандидатов из полного каталога с помощью ANN-поиска, BM25, collaborative filtering или других лёгких методов.
Reranking (переранжирование) — более точная модель берёт эти 100–500 кандидатов и расставляет их в оптимальном для данного пользователя и контекста порядке.

Каталог: 500 000 SKU
↓ Candidate retrieval (ANN, BM25)
Кандидаты: 300 товаров
↓ Reranking (gradient boosting / нейросеть)
Финальная выдача: топ-10 для виджета

Разделение позволяет балансировать между скоростью (retrieval) и качеством (reranking).

Что учитывает модель переранжирования

В отличие от первичной выборки, reranking-модель работает с богатым набором признаков:

Группа признаков	Примеры
Пользовательские	Affinity-профиль, история покупок, длина сессии
Товарные	Маржа, наличие, рейтинг, популярность категории
Контекстные	Устройство, время суток, текущая категория
Реляционные	Насколько товар соответствует профилю пользователя
Бизнес-сигналы	Продвигаемые SKU, акционные позиции

Модели: градиентный бустинг (LightGBM, XGBoost), нейросетевые ранкеры, или гибриды.

Бизнес-правила в переранжировании

Переранжирование — точка, где ML-персонализация встречается с бизнес-логикой. Есть два способа встраивания правил:

Hard constraints — применяются поверх модели:
— Товары out-of-stock всегда в хвосте выдачи
— Запрещённые к продаже позиции исключены полностью
— Обязательный буст приоритетных SKU

Soft constraints — через признаки в модели:
— Маржа как дополнительный признак — модель учитывает, но не всегда следует
— Сигналы свежести, трендовости — влияют с настраиваемым весом

Совет: не закладывайте слишком жёстких буст-правил на популярные товары — они уже хорошо ранжируются по персонализации. Буст имеет смысл для «недооткрытых» позиций с хорошей маржой, которые алгоритм недооценивает из-за недостатка исторических данных.

Диверсность как задача переранжирования

Реранкинг также решает задачу диверсности: если все топ-10 кандидатов — джинсы одного бренда, это не лучший опыт. Алгоритмы диверсификации (MMR — Maximal Marginal Relevance, DPP — Determinantal Point Processes) встраиваются в этот этап, балансируя релевантность и разнообразие выдачи.

Частые вопросы

Зачем нужен отдельный этап переранжирования, если первичная модель уже ранжирует?

Первичная модель (ANN, BM25) оптимизирована на скорость: за миллисекунды выбрать из миллионов товаров топ-500 кандидатов. Переранжирование работает с небольшим списком, поэтому может использовать тяжёлые признаки — историю пользователя, текущую сессию, наличие на складе, маржу — без потери latency в целом.

Как бизнес-правила сочетаются с ML-ранжированием?

Есть два подхода: hard constraints (всегда ставить OOS-товары в конец, обязательный буст продвигаемых SKU) и soft constraints через добавление бизнес-сигналов в признаки модели. Второй подход гибче, но требует аккуратной настройки весов, чтобы бизнес-цели не убивали персонализацию.

Какие признаки используют модели переранжирования?

Пользовательские (история кликов, покупок, affinity-профиль), товарные (маржа, популярность, отзывы, наличие), контекстные (устройство, время, категория, сессия), реляционные (interaction features: насколько товар соответствует профилю конкретного пользователя).

Gravity Field