Что такое llms.txt и зачем он нужен
llms.txt — текстовый файл в корне сайта (/llms.txt), написанный в формате Markdown. Его задача — дать языковым моделям и ИИ-агентам структурированный ответ на вопрос «что представляет собой этот сайт и что здесь важно прочитать». Инициатива возникла в 2024 году как реакция на рост ИИ-поисковиков, которые перестают просматривать весь контент страниц — им нужна упаковка.
Важно: по состоянию на конец 2025 года llms.txt — это предложение сообщества, не ратифицированный стандарт W3C. Тем не менее его поддержали Perplexity, Kagi, Jina AI и ряд других платформ.
Структура файла
Типичный llms.txt состоит из нескольких секций:
# Название сайта
> Краткое описание: что это, для кого, в чём ценность.
## Ключевые разделы
- [Продукт](/product): описание основных возможностей
- [Документация](/docs): API, интеграции, how-to
- [Кейсы](/cases): реальные результаты с клиентами
## Не цитировать
- /admin, /user, /cart (интерфейсные страницы без ценности)
Дополнительно рекомендуется указать язык сайта, ключевые темы и примеры лучших страниц для обучения или цитирования.
Три слоя управления краулерами
| Файл | Кому предназначен | Что сообщает |
|---|---|---|
| robots.txt | Поисковые краулеры | Что не нужно обходить |
| sitemap.xml | Поисковые индексаторы | Что нужно проиндексировать |
| llms.txt | ИИ-модели и агенты | Как понять сайт и что цитировать |
Эти три файла дополняют друг друга и не конкурируют.
Как применять в e-commerce
Для интернет-магазина llms.txt особенно полезен, если:
- На сайте большой контентный раздел (блог, кейсы, глоссарий) — нужно направить агентов к лучшим материалам
- Есть документация API — ИИ-разработчики найдут нужное быстрее
- Компания рассчитывает на цитируемость в ответах ИИ-поисковиков по профильным запросам
Совет: включите в llms.txt не только ссылки на разделы, но и краткий «кто мы» в первом абзаце — это ускоряет понимание контекста для RAG-систем.
Ограничения и честные ожидания
llms.txt не гарантирует попадание в ответы LLM. Он снижает барьер для цитирования, но не заменяет качественный контент, авторитетность домена и структуру. Если страницы написаны плохо или не индексированы — файл не поможет.