Latency

Latency / Задержка · Задержка · время ответа · p99 · p95

Определение

Latency — время ответа системы на запрос; для API платформ персонализации измеряется в процентилях (p50/p95/p99) и является ключевым параметром SLA, напрямую влияющим на конверсию интернет-магазина.

Как измеряется latency

Latency описывают через распределение, а не одно число. Стандартный набор метрик:

Метрика	Что означает
p50 (медиана)	Половина запросов выполняется быстрее этого значения
p95	95% запросов выполняется быстрее; 5% — медленнее
p99	99% запросов выполняется быстрее; 1% — медленнее («хвост»)
p999	Применяется для систем с очень строгими требованиями

Распределение latency (мс):
p50  = 12 мс   ← типичный быстрый запрос
p95  = 38 мс   ← 5% чуть медленнее
p99  = 87 мс   ← «хвосты» — кэш-мисс, GC-паузы
p999 = 420 мс  ← редкие выбросы

SLA платформы персонализации обычно задаётся через p99 — это «гарантированное» поведение системы, исключая редчайшие аномалии.

Источники задержки в API персонализации

Итоговая latency складывается из нескольких компонент:

Сетевая задержка (RTT) — время в пути до дата-центра и обратно. Снижается через CDN и размещение поближе к пользователям.
Очередь на сервере — при пиковой нагрузке запросы ждут освобождения воркера.
Вычисление рекомендаций — поиск ближайших соседей по векторной базе или применение модели ранжирования.
Доступ к данным — чтение профиля пользователя, истории, контекста сессии из хранилища.
Сериализация ответа — формирование JSON и его сжатие.

Совет: кэшируйте предвычисленные рекомендации для популярных сценариев (топ товаров, часто просматриваемые категории). Персонализированные рекомендации пересчитывайте асинхронно, а не в критическом пути загрузки страницы — это снижает p99 на порядок.

Latency и Core Web Vitals

В контексте загрузки страницы latency API персонализации прямо влияет на LCP (Largest Contentful Paint), если рекомендательный виджет попадает в критический рендеринг. Рекомендательные блоки в подвале страницы или под fold не влияют на LCP, что делает lazy loading виджетов стандартной практикой для оптимизации Core Web Vitals при работе с платформами персонализации.

Частые вопросы

Почему измеряют p99, а не среднее значение?

Среднее скрывает «хвосты» распределения. Если 99% запросов выполняются за 20 мс, а 1% — за 5 секунд, среднее покажет ~70 мс и создаст иллюзию хорошей производительности. p99 показывает, что 1 из 100 пользователей ждёт 5 секунд — для нагруженного магазина это тысячи плохих UX в день.

Какая задержка допустима для рекомендательного API?

Отраслевые ориентиры: p50 < 20 мс, p95 < 50 мс, p99 < 100 мс. Если API рекомендаций участвует в критическом пути загрузки страницы — хуже 100 мс по p99 влечёт заметное ухудшение LCP. Для некритичных виджетов (рекомендации в подвале) допустимо p99 до 200–300 мс.

Как latency связана с конверсией?

Исследования Google (2017–2019) показывают: рост времени загрузки страницы с 1 до 3 секунд повышает вероятность отказа на 32%. Для e-commerce прямая связь — каждые дополнительные 100 мс задержки коррелируют со снижением конверсии на 1–7% в зависимости от вертикали.

Gravity Field

Персонализация для e-commerce — на одной платформе

Gravity Field помогает онлайн-ритейлерам растить конверсию, средний чек и удержание за счёт персонализации на всех этапах пути покупателя — без перегрузки IT.

✦Товарные рекомендации и merchandising-правила

✦A/B-тесты с байесовской статистикой и автопилотом (MAB)

✦Персонализация контента, PLP и сегментация аудитории

✦AI Shopping Assistant с доказанным ростом выручки на визит

Запросить демо →