🤖 AI / ML

Галлюцинация ИИ

AI Hallucination · hallucination · галлюцинация модели · LLM hallucination

Определение

Галлюцинация ИИ — явление, при котором языковая модель генерирует фактически неверные или вымышленные утверждения с высокой уверенностью, не опираясь на реальные данные.

Почему это важно для e-commerce

В общем чат-боте галлюцинация неприятна. В AI Shopping Assistant она напрямую влияет на бизнес:
— Пользователь узнаёт от ассистента несуществующие характеристики товара → покупает → разочаровывается → возврат + потеря доверия
— Ассистент уверенно указывает неверную цену → конфликт при оформлении заказа
— Бот «придумывает» совместимость товаров (например, зарядное устройство к ноутбуку) → оформлен несовместимый набор

Причины и механизм

LLM не «знает» факты в традиционном смысле — она хранит паттерны из обучающего корпуса. При генерации ответа модель следует принципу «наиболее вероятное продолжение», а не «верифицированный факт».

Галлюцинации чаще возникают в трёх ситуациях:
1. Вопрос об очень специфичных, редких или свежих данных (новый SKU, нишевый товар)
2. Запрос числовых фактов (цены, технические характеристики, габариты)
3. Конфликт между несколькими источниками в обучающих данных

Методы снижения

RAG (Retrieval-Augmented Generation)

Самый эффективный подход для e-commerce. Перед генерацией ответа система ищет релевантные документы в векторной базе данных (каталог, FAQ, описания категорий) и добавляет их в контекст запроса. Модель отвечает, опираясь на эти документы, а не на «память».

Prompt engineering

Инструкции в системном промпте снижают галлюцинации: «Отвечай только на основе предоставленного каталога. Если информация отсутствует — сообщи об этом, не придумывай.»

Верификация выхода

Пост-обработка ответов: отдельная модель или детерминированная логика проверяет, что артикулы и цены из ответа реально существуют в каталоге. Несуществующие ссылки — автоматически удаляются или заменяются.

Важно: RAG не устраняет галлюцинации полностью — если в контексте нет нужной информации, модель может «додумать». Правильная архитектура должна явно обрабатывать случай «информация не найдена» и сообщать об этом пользователю.

Частые вопросы

Почему LLM галлюцинирует?

Языковые модели обучены предсказывать «наиболее вероятный следующий токен», а не «наиболее достоверный ответ». Когда модель не знает точного ответа, она генерирует правдоподобно звучащий текст на основе паттернов из обучающей выборки. Уверенность подачи при этом не коррелирует с фактической точностью.

Как RAG снижает галлюцинации?

RAG (Retrieval-Augmented Generation) заставляет модель опираться на конкретные документы из базы знаний, а не на «вспомненные» факты. В e-commerce: ассистент сначала ищет релевантные карточки товаров в каталоге, затем отвечает пользователю строго на основе найденного. Галлюцинация возможна только если в RAG-контексте нет нужной информации.

Как измерить уровень галлюцинаций в AI Shopping Assistant?

Через автоматизированный eval: формируют набор вопросов с известными правильными ответами (характеристики товаров из каталога), прогоняют ассистента и сравнивают ответы с эталоном. Метрики — Factual Accuracy, Faithfulness (насколько ответ соответствует источнику), Hallucination Rate.

Gravity Field

Галлюцинации и Gravity Field AI Shopping Assistant

Gravity Field AI Shopping Assistant работает на базе RAG-архитектуры с grounding по товарному каталогу клиента, что минимизирует галлюцинации в ответах об ассортименте.

✦RAG по реальному товарному каталогу — ответы строятся на актуальных данных

✦{'Grounding': 'ссылки на конкретные карточки товаров в ответах ассистента'}

✦Контроль выхода за пределы каталога — ассистент не выдумывает отсутствующие товары

Посмотреть функциональность →