🤖 AI / ML

LLM

Large Language Model · большая языковая модель · языковая модель · GPT · Llama · Claude

Определение

LLM (Large Language Model) — языковая модель с миллиардами параметров, обученная на больших текстовых корпусах методом авторегрессионного предсказания токенов, способная к понимания языка, следованию инструкциям и генерации текста.

Как устроен LLM

LLM — нейронная сеть трансформерной архитектуры с миллиардами параметров. Обучение происходит на огромных текстовых корпусах (веб-страницы, книги, код) методом авторегрессии: модель учится предсказывать следующий токен по предыдущим.

После базового обучения модель проходит RLHF (Reinforcement Learning from Human Feedback) — дообучение на оценках людей, которое делает её полезной и безопасной в диалоге.

Входной контекст:  "Ищу куртку для зимних прогулок до —20°C,
                    бюджет до 15 000 рублей"

Токенизация → [Ищу] [куртку] [для] [зимних] ... → 18 токенов
Трансформер обрабатывает контекст, механизм внимания взвешивает связи
Ответ генерируется токен за токеном: [Для] [температур] [до] [—20°С] ...

Применение в e-commerce

AI Shopping Assistant

Главное коммерческое применение LLM в ритейле — диалоговый помощник. Покупатель описывает задачу в произвольной форме («подарок маме на 60 лет, любит садоводство, бюджет 3–5 тысяч»), LLM интерпретирует намерение и, используя RAG для доступа к актуальному каталогу, возвращает конкретные рекомендации с объяснением.

Семантический поиск

Классический поиск по точному совпадению не обрабатывает синонимы и опечатки. LLM-эмбеддинги позволяют находить товары по семантической близости запроса и описания — «чехол, который не скользит» находит товары с атрибутом «нескользящее покрытие», хотя эти слова не совпадают.

Генерация контента

Автоматическое создание описаний товаров на основе атрибутов, SEO-оптимизированных заголовков, ответов на типичные вопросы покупателей — применения LLM в операционных задачах, не требующих сложной интеграции.

Ограничения в коммерческих продуктах

Риск	Описание	Митигация
Галлюцинации	Модель «придумывает» характеристики	RAG — только факты из каталога
Устаревшие данные	Базовая модель обучена на данных прошлого	Актуальный контекст через RAG
Латентность	Генерация токенов занимает время	Streaming-ответы, кэширование контекста
Стоимость	API-вызовы LLM дороже обычных запросов	Кэширование, оптимизация промптов

Частые вопросы

Чем LLM отличается от обычного чат-бота?

Классический чат-бот следует жёстким скриптам — дерево решений или шаблонные ответы на ключевые слова. LLM понимает намерение в произвольной формулировке, поддерживает контекст диалога и генерирует ответы, адаптированные к запросу. Вместо «напишите команду из списка» LLM обрабатывает «ищу что-то тёплое для осенних прогулок до 5000 рублей».

Что такое галлюцинации LLM и как с ними бороться?

Галлюцинации — когда LLM генерирует правдоподобные, но ложные утверждения. В e-commerce критично: модель не должна «придумывать» характеристики товаров. Решение — RAG (Retrieval-Augmented Generation): LLM отвечает только на основе актуальных данных из каталога, а не из своих параметров.

Как LLM применяется в поиске по интернет-магазину?

Семантический поиск с LLM понимает запросы с опечатками, синонимами и намерениями, которые не совпадают с точными названиями товаров. Запрос «что одеть на корпоратив» разбирается в категории (одежда), контекст (формальное мероприятие), и возвращает релевантные товары без ключевого слова в точном виде.

Нужно ли дообучать LLM на данных магазина?

Для базовых сценариев (поиск, генерация описаний) — нет. Достаточно промпт-инжиниринга и RAG с актуальным каталогом. Файн-тюнинг нужен для специфичных задач с особым тоном коммуникации или предметной областью, не покрытой базовым обучением модели.

Gravity Field

LLM в Gravity Field

Gravity Field использует LLM в AI Shopping Assistant — диалоговом помощнике, который ведёт покупателя к нужному товару через естественный разговор и рекомендации на основе RAG.

✦Диалоговый AI Shopping Assistant на базе LLM + RAG

✦Понимание намерений покупателя в свободной формулировке

✦Генерация рекомендаций на основе актуального каталога

✦A/B-оптимизация диалоговых сценариев

Посмотреть функциональность →

LLM