Как устроен LLM

LLM — нейронная сеть трансформерной архитектуры с миллиардами параметров. Обучение происходит на огромных текстовых корпусах (веб-страницы, книги, код) методом авторегрессии: модель учится предсказывать следующий токен по предыдущим.

После базового обучения модель проходит RLHF (Reinforcement Learning from Human Feedback) — дообучение на оценках людей, которое делает её полезной и безопасной в диалоге.

Входной контекст:  "Ищу куртку для зимних прогулок до —20°C,
                    бюджет до 15 000 рублей"

Токенизация → [Ищу] [куртку] [для] [зимних] ... → 18 токенов
Трансформер обрабатывает контекст, механизм внимания взвешивает связи
Ответ генерируется токен за токеном: [Для] [температур] [до] [—20°С] ...

Применение в e-commerce

AI Shopping Assistant

Главное коммерческое применение LLM в ритейле — диалоговый помощник. Покупатель описывает задачу в произвольной форме («подарок маме на 60 лет, любит садоводство, бюджет 3–5 тысяч»), LLM интерпретирует намерение и, используя RAG для доступа к актуальному каталогу, возвращает конкретные рекомендации с объяснением.

Семантический поиск

Классический поиск по точному совпадению не обрабатывает синонимы и опечатки. LLM-эмбеддинги позволяют находить товары по семантической близости запроса и описания — «чехол, который не скользит» находит товары с атрибутом «нескользящее покрытие», хотя эти слова не совпадают.

Генерация контента

Автоматическое создание описаний товаров на основе атрибутов, SEO-оптимизированных заголовков, ответов на типичные вопросы покупателей — применения LLM в операционных задачах, не требующих сложной интеграции.

Ограничения в коммерческих продуктах

Риск Описание Митигация
Галлюцинации Модель «придумывает» характеристики RAG — только факты из каталога
Устаревшие данные Базовая модель обучена на данных прошлого Актуальный контекст через RAG
Латентность Генерация токенов занимает время Streaming-ответы, кэширование контекста
Стоимость API-вызовы LLM дороже обычных запросов Кэширование, оптимизация промптов