Структура нейронной сети
Нейронная сеть организована в слои. Данные проходят через них слева направо — от входного слоя к выходному:
- Входной слой — принимает признаки: ID пользователя, ID товара, характеристики сессии, поведенческие эмбеддинги.
- Скрытые слои — применяют линейные преобразования (умножение на матрицу весов) и нелинейные активации. Именно здесь сеть «учится» нужным признакам.
- Выходной слой — производит предсказание: вероятность покупки, оценку релевантности, вектор-эмбеддинг.
Вход: [user_id, item_id, session_depth, hour_of_day, ...]
→ Dense(256, ReLU)
→ Dense(128, ReLU)
→ Dense(64, ReLU)
→ Dense(1, Sigmoid) → P(purchase) = 0.73
Как обучается нейронная сеть
Обучение — итерационный процесс. На каждом шаге:
- Forward pass: данные проходят через слои, сеть делает предсказание.
- Вычисление ошибки: функция потерь (loss) сравнивает предсказание с реальным ответом.
- Backpropagation: градиент ошибки распространяется назад по слоям.
- Обновление весов: оптимизатор (SGD, Adam) корректирует параметры сети в сторону уменьшения ошибки.
После миллионов таких шагов сеть находит веса, которые минимизируют ошибку на обучающей выборке.
Применения нейросетей в e-commerce
| Задача | Архитектура | Вход |
|---|---|---|
| Рекомендации | Two-Tower, MLP | Эмбеддинги пользователей и товаров |
| Ранжирование поиска | BERT/Transformer | Текстовые запросы + атрибуты товаров |
| Предсказание оттока | MLP, LSTM | Последовательность покупок, частота визитов |
| Визуальный поиск | CNN + CLIP | Изображения товаров |
| AI-ассистент | Transformer (LLM) | Диалоговый контекст + каталог |
Важно: Нейросети требуют значительно больше данных для обучения, чем традиционные методы (градиентный бустинг, коллаборативная фильтрация). При объёме транзакций менее 100K–500K в месяц сети часто уступают более простым моделям из-за переобучения.
Нейросети vs традиционные алгоритмы рекомендаций
Коллаборативная фильтрация (matrix factorization) работает хорошо на больших датасетах взаимодействий «пользователь–товар», но не умеет использовать дополнительные признаки (контекст сессии, время суток, атрибуты товара). Нейросети объединяют все типы признаков в единую модель, что даёт преимущество при наличии богатого фичер-пространства.