Как устроен LLM
LLM — нейронная сеть трансформерной архитектуры с миллиардами параметров. Обучение происходит на огромных текстовых корпусах (веб-страницы, книги, код) методом авторегрессии: модель учится предсказывать следующий токен по предыдущим.
После базового обучения модель проходит RLHF (Reinforcement Learning from Human Feedback) — дообучение на оценках людей, которое делает её полезной и безопасной в диалоге.
Входной контекст: "Ищу куртку для зимних прогулок до —20°C,
бюджет до 15 000 рублей"
Токенизация → [Ищу] [куртку] [для] [зимних] ... → 18 токенов
Трансформер обрабатывает контекст, механизм внимания взвешивает связи
Ответ генерируется токен за токеном: [Для] [температур] [до] [—20°С] ...
Применение в e-commerce
AI Shopping Assistant
Главное коммерческое применение LLM в ритейле — диалоговый помощник. Покупатель описывает задачу в произвольной форме («подарок маме на 60 лет, любит садоводство, бюджет 3–5 тысяч»), LLM интерпретирует намерение и, используя RAG для доступа к актуальному каталогу, возвращает конкретные рекомендации с объяснением.
Семантический поиск
Классический поиск по точному совпадению не обрабатывает синонимы и опечатки. LLM-эмбеддинги позволяют находить товары по семантической близости запроса и описания — «чехол, который не скользит» находит товары с атрибутом «нескользящее покрытие», хотя эти слова не совпадают.
Генерация контента
Автоматическое создание описаний товаров на основе атрибутов, SEO-оптимизированных заголовков, ответов на типичные вопросы покупателей — применения LLM в операционных задачах, не требующих сложной интеграции.
Ограничения в коммерческих продуктах
| Риск | Описание | Митигация |
|---|---|---|
| Галлюцинации | Модель «придумывает» характеристики | RAG — только факты из каталога |
| Устаревшие данные | Базовая модель обучена на данных прошлого | Актуальный контекст через RAG |
| Латентность | Генерация токенов занимает время | Streaming-ответы, кэширование контекста |
| Стоимость | API-вызовы LLM дороже обычных запросов | Кэширование, оптимизация промптов |