🤖 AI / ML

Two-Tower модель

Two-Tower Model · dual encoder · две башни · dual-encoder model

Определение

Two-tower model — архитектура нейронных рекомендательных систем с двумя раздельными энкодерами для пользователя и товара, обучаемая на задаче максимизации скалярного произведения пар (пользователь, релевантный товар).

Идея: разделить запрос и каталог

Суть two-tower model — сделать так, чтобы поиск похожих товаров для пользователя был быстрым при любом размере каталога. Для этого пользователь и товар кодируются раздельно в один и тот же векторный space. Релевантность измеряется через скалярное произведение (или косинусное сходство) векторов.

Ключевое свойство: товарные векторы вычисляются один раз и хранятся в векторной базе данных. Для онлайн-запроса нужно только вычислить вектор пользователя и выполнить ANN-поиск — это занимает миллисекунды независимо от размера каталога.

query_vec = user_tower(user_features)
candidate_vecs = item_tower(item_features)  ← предвычислено
scores = dot_product(query_vec, candidate_vecs)
top_k = ANN_search(query_vec, index)

Архитектура и обучение

Каждая башня — нейронная сеть произвольной архитектуры. Стандартный вариант: несколько полносвязных слоёв (MLP) поверх входных признаков. Для истории взаимодействий пользователя используют mean pooling эмбеддингов или трансформер.

Модель обучается на парах взаимодействий. Наиболее распространённый подход — in-batch negatives: для каждого позитивного примера (пользователь, купленный товар) в качестве негативов берут все остальные товары в батче. Это дёшево и достаточно эффективно при большом размере батча.

Компонент	Пример для e-commerce
User tower вход	История последних N товаров, категории интереса, RFM-признаки
Item tower вход	ID товара, категория, текстовый эмбеддинг названия, цена, бренд
Loss function	In-batch softmax, BPR (Bayesian Personalized Ranking)
Метрика качества	Recall@K, NDCG@K

Двухэтапная архитектура: retrieval + ranking

Two-tower model обычно работает на первом этапе — candidate retrieval: отобрать тысячи кандидатов из миллионного каталога за миллисекунды. На втором этапе более сложная модель (gradient boosting или reranking-сеть) ранжирует кандидатов с учётом дополнительных признаков.

Такое разделение позволяет применять тяжёлые модели к малому числу кандидатов и избегать пересчёта всего каталога на каждый запрос.

Совет: при холодном старте для нового товара (item cold start) two-tower выигрывает у матричной факторизации — товарная башня использует текстовые атрибуты, не требующие истории взаимодействий. Для нового пользователя — аналогично через контекстные признаки.

Частые вопросы

Почему две отдельные башни, а не одна сеть?

Если объединить пользователя и товар в одну сеть, для каждой пары нужно выполнять полный прямой проход — это O(users × items) вычислений. С двумя башнями товарные векторы предвычисляются один раз и хранятся в векторной базе. Для запроса нужно только вычислить вектор пользователя и найти ближайших соседей через ANN — это масштабируется до миллионов товаров.

Как обучается two-tower модель?

На парах (пользователь, товар) с метками взаимодействия (клик, покупка). Чаще используют contrastive learning или in-batch negatives — позитивная пара (пользователь, купленный товар) и случайные негативы из батча. Цель — приблизить векторы релевантных пар и отдалить нерелевантных.

Как two-tower модель применяется в поиске?

В семантическом поиске одна башня кодирует поисковый запрос, другая — товарный каталог. Векторы товаров предвычисляются; при поиске вектор запроса сравнивается с каталогом через ANN. Это позволяет находить релевантные товары даже при несовпадении ключевых слов.

Какова типичная архитектура каждой башни?

Для пользователя — усреднение embeddings взаимодействий (MLP поверх mean pooling истории) или трансформер на последовательности. Для товара — MLP поверх эмбеддингов текстовых атрибутов (название, категория, описание). Глубина зависит от задачи и объёма данных.

Gravity Field

Персонализация для e-commerce — на одной платформе

Gravity Field помогает онлайн-ритейлерам растить конверсию, средний чек и удержание за счёт персонализации на всех этапах пути покупателя — без перегрузки IT.

✦Товарные рекомендации и merchandising-правила

✦A/B-тесты с байесовской статистикой и автопилотом (MAB)

✦Персонализация контента, PLP и сегментация аудитории

✦AI Shopping Assistant с доказанным ростом выручки на визит

Запросить демо →