Почему это важно для e-commerce
В общем чат-боте галлюцинация неприятна. В AI Shopping Assistant она напрямую влияет на бизнес:
— Пользователь узнаёт от ассистента несуществующие характеристики товара → покупает → разочаровывается → возврат + потеря доверия
— Ассистент уверенно указывает неверную цену → конфликт при оформлении заказа
— Бот «придумывает» совместимость товаров (например, зарядное устройство к ноутбуку) → оформлен несовместимый набор
Причины и механизм
LLM не «знает» факты в традиционном смысле — она хранит паттерны из обучающего корпуса. При генерации ответа модель следует принципу «наиболее вероятное продолжение», а не «верифицированный факт».
Галлюцинации чаще возникают в трёх ситуациях:
1. Вопрос об очень специфичных, редких или свежих данных (новый SKU, нишевый товар)
2. Запрос числовых фактов (цены, технические характеристики, габариты)
3. Конфликт между несколькими источниками в обучающих данных
Методы снижения
RAG (Retrieval-Augmented Generation)
Самый эффективный подход для e-commerce. Перед генерацией ответа система ищет релевантные документы в векторной базе данных (каталог, FAQ, описания категорий) и добавляет их в контекст запроса. Модель отвечает, опираясь на эти документы, а не на «память».
Prompt engineering
Инструкции в системном промпте снижают галлюцинации: «Отвечай только на основе предоставленного каталога. Если информация отсутствует — сообщи об этом, не придумывай.»
Верификация выхода
Пост-обработка ответов: отдельная модель или детерминированная логика проверяет, что артикулы и цены из ответа реально существуют в каталоге. Несуществующие ссылки — автоматически удаляются или заменяются.
Важно: RAG не устраняет галлюцинации полностью — если в контексте нет нужной информации, модель может «додумать». Правильная архитектура должна явно обрабатывать случай «информация не найдена» и сообщать об этом пользователю.