Структура нейронной сети

Нейронная сеть организована в слои. Данные проходят через них слева направо — от входного слоя к выходному:

  • Входной слой — принимает признаки: ID пользователя, ID товара, характеристики сессии, поведенческие эмбеддинги.
  • Скрытые слои — применяют линейные преобразования (умножение на матрицу весов) и нелинейные активации. Именно здесь сеть «учится» нужным признакам.
  • Выходной слой — производит предсказание: вероятность покупки, оценку релевантности, вектор-эмбеддинг.
Вход: [user_id, item_id, session_depth, hour_of_day, ...]
  → Dense(256, ReLU)
  → Dense(128, ReLU)
  → Dense(64, ReLU)
  → Dense(1, Sigmoid)  → P(purchase) = 0.73

Как обучается нейронная сеть

Обучение — итерационный процесс. На каждом шаге:

  1. Forward pass: данные проходят через слои, сеть делает предсказание.
  2. Вычисление ошибки: функция потерь (loss) сравнивает предсказание с реальным ответом.
  3. Backpropagation: градиент ошибки распространяется назад по слоям.
  4. Обновление весов: оптимизатор (SGD, Adam) корректирует параметры сети в сторону уменьшения ошибки.

После миллионов таких шагов сеть находит веса, которые минимизируют ошибку на обучающей выборке.

Применения нейросетей в e-commerce

Задача Архитектура Вход
Рекомендации Two-Tower, MLP Эмбеддинги пользователей и товаров
Ранжирование поиска BERT/Transformer Текстовые запросы + атрибуты товаров
Предсказание оттока MLP, LSTM Последовательность покупок, частота визитов
Визуальный поиск CNN + CLIP Изображения товаров
AI-ассистент Transformer (LLM) Диалоговый контекст + каталог

Важно: Нейросети требуют значительно больше данных для обучения, чем традиционные методы (градиентный бустинг, коллаборативная фильтрация). При объёме транзакций менее 100K–500K в месяц сети часто уступают более простым моделям из-за переобучения.

Нейросети vs традиционные алгоритмы рекомендаций

Коллаборативная фильтрация (matrix factorization) работает хорошо на больших датасетах взаимодействий «пользователь–товар», но не умеет использовать дополнительные признаки (контекст сессии, время суток, атрибуты товара). Нейросети объединяют все типы признаков в единую модель, что даёт преимущество при наличии богатого фичер-пространства.