🔍 SEO / GEO

Индексация

Indexation · индексирование · добавление в индекс

Определение

Индексация — процесс сканирования страниц поисковым ботом и добавления их в поисковый индекс, после чего страницы становятся доступны к показу в выдаче по релевантным запросам.

Что такое индексация и зачем она нужна

Поисковая система не показывает страницы «напрямую» — она работает с предварительно созданным индексом. Индекс — это гигантская база данных, где каждой странице соответствует набор ключевых слов, метрик авторитетности и технических характеристик.

Путь страницы в выдачу выглядит так:

Обнаружение → Краулинг → Рендеринг → Индексация → Ранжирование
     ↑               ↑           ↑            ↑
 sitemap /         Googlebot    JavaScript    Поисковый
внутренние      скачивает HTML  выполнен     индекс
  ссылки

Страница, не прошедшая любой из этапов, не попадёт в выдачу — независимо от качества контента.

Что мешает индексации

Технические блокировки

robots.txt — файл с инструкциями для ботов. Disallow: /page запрещает краулинг, но не гарантирует отсутствие в индексе (страница может быть проиндексирована по внешним ссылкам без посещения бота).

Мета-тег noindex — надёжный способ исключить страницу из индекса:

<meta name="robots" content="noindex, nofollow">

Проблемы с рендерингом — если контент генерируется JavaScript и бот не дождался его выполнения, страница попадёт в индекс как пустая.

Структурные проблемы

Проблема	Описание	Решение
Страница-сирота	Нет входящих внутренних ссылок	Добавить ссылки из разделов сайта
Дублирование	Несколько URL с одинаковым контентом	Canonical-тег на мастер-версию
Пагинация	/page=2, /page=3 индексируются отдельно	rel=»canonical» или rel=»next/prev»
URL с параметрами	?sort=price&filter=new — миллионы вариаций	Disallow в robots.txt на параметры

Индексация в e-commerce: специфика

Интернет-магазины сталкиваются с уникальными проблемами:

Страницы фасетного поиска — /category?color=red&size=M&brand=Nike могут генерировать тысячи страниц с дублирующимся контентом. Их массовая индексация растрачивает crawl budget и создаёт дублирование.

Страницы товаров «не в наличии» — удалять из индекса или оставлять? Если товар временно отсутствует — оставлять. Если снят с продажи навсегда — 301-редирект на ближайший аналог или категорию.

Карточки товаров без описания — бот индексирует страницу с одним изображением и SKU. Ценности для SEO ноль, но расходует crawl budget.

Важно: в Яндексе и Google логика приоритизации индексации различается. Яндекс более консервативен: новые страницы могут ждать обхода дольше. Sitemap с <lastmod> помогает ускорить переиндексацию при обновлении контента.

Мониторинг статуса индексации

Google Search Console — раздел «Охват» (Coverage): показывает количество проиндексированных страниц, исключённых и ошибок. «Проверка URL» позволяет проверить статус конкретной страницы.

Яндекс.Вебмастер — «Индексирование» → «Страницы в поиске» показывает историю изменений индекса. Инструмент «Переобход страниц» ускоряет обновление изменённых страниц.

Регулярный мониторинг позволяет вовремя заметить, если новые страницы перестали индексироваться или из индекса выпал важный раздел сайта.

Частые вопросы

Как проверить, проиндексирована ли страница?

В Google: оператор site:домен в поисковой строке покажет проиндексированные страницы; Google Search Console → «Проверка URL» даёт точный статус. В Яндексе: оператор url:адрес или Яндекс.Вебмастер → «Страницы в поиске».

Почему страница не попадает в индекс?

Основные причины: тег <meta name="robots" content="noindex"> в коде; директива Disallow в robots.txt для Googlebot; страница не имеет входящих внутренних ссылок (сирота); сервер возвращает ошибку (5xx) или редирект-петлю; дублирующийся контент, когда каноникал указывает на другую страницу; JavaScript-рендеринг, который бот не дождался.

Как ускорить индексацию новых страниц?

Добавить страницу в XML-sitemap и запросить переобход в Search Console / Вебмастере. Разместить внутренние ссылки на новую страницу с уже проиндексированных страниц сайта. Для Яндекса — IndexNow API позволяет мгновенно уведомить о новой странице.

Сколько времени занимает индексация новой страницы?

Google обходит крупные сайты за часы–дни, небольшие — за 1–4 недели. Яндекс — от нескольких дней до нескольких недель. Скорость зависит от crawl budget сайта, количества входящих ссылок на страницу и авторитетности домена.

Gravity Field

Персонализация для e-commerce — на одной платформе

Gravity Field помогает онлайн-ритейлерам растить конверсию, средний чек и удержание за счёт персонализации на всех этапах пути покупателя — без перегрузки IT.

✦Товарные рекомендации и merchandising-правила

✦A/B-тесты с байесовской статистикой и автопилотом (MAB)

✦Персонализация контента, PLP и сегментация аудитории

✦AI Shopping Assistant с доказанным ростом выручки на визит

Запросить демо →