SLA

Service Level Agreement · Service Level Agreement · соглашение об уровне сервиса · uptime

Определение

SLA — формальные обязательства поставщика по доступности и производительности сервиса; для платформ персонализации ключевые метрики SLA — uptime (не ниже 99.9%) и p99 latency API-эндпоинтов.

Ключевые параметры SLA

Стандартный SLA для платформы персонализации включает несколько измеримых параметров:

Параметр	Типичный порог	Что означает
Uptime	99.9–99.99%	Доля времени, когда сервис доступен
API p99 latency	≤ 100–300 мс	99% запросов быстрее этого порога
API p95 latency	≤ 50–150 мс	95% запросов быстрее этого порога
Время реакции поддержки	1–4 часа (P1)	Критические инциденты
RPO / RTO	1–4 часа	Восстановление данных / сервиса после сбоя

Для виджетов рекомендаций, встроенных в синхронный HTTP-запрос страницы, p99 latency ≤ 100 мс — критичное требование. Медленный API рекомендаций замедляет загрузку страницы целиком.

Graceful Degradation при нарушении SLA

Правильная интеграция платформы персонализации строится с расчётом на то, что SLA может нарушиться. Паттерны защиты:

Таймаут + fallback. Запрос к API персонализации ограничен 200–300 мс. Если ответ не получен — показывается fallback (бестселлеры, популярные в категории, кешированные рекомендации).

Асинхронная загрузка. Виджет рекомендаций подгружается после основного контента страницы (lazy loading через JavaScript). Нарушение SLA не влияет на загрузку ключевого контента.

Кеш рекомендаций. Рекомендации кешируются на CDN или уровне приложения на 5–15 минут. При недоступности API возвращается кеш — слегка устаревший, но не пустой.

Совет: при выборе платформы персонализации запрашивайте не только uptime, но и историю инцидентов за последние 12 месяцев и среднее время восстановления (MTTR). SLA — это обещание; MTTR — реальность.

SLA и распродажи

Пиковая нагрузка на распродажах (Black Friday, 11.11) — испытание для SLA. В это время нарушение SLA наиболее болезненно: трафик максимальный, цена каждой конверсии высока. Перед крупными распродажами стоит заблаговременно:
— подтвердить у провайдера готовность к нагрузке;
— настроить агрессивный кеш рекомендаций;
— проверить работу fallback на staging-среде.

Частые вопросы

Что означают 99.9% и 99.99% uptime на практике?

99.9% uptime = ~8.7 часов допустимого простоя в год, или ~43 минуты в месяц. 99.99% = ~52 минуты в год, или ~4.4 минуты в месяц. Разница в одну девятку — это разница между несколькими инцидентами в год и практически нулевым плановым downtime.

Что такое p99 latency и почему важна именно эта метрика?

p99 (99-й перцентиль задержки) — время ответа, которое занимает не более 99% запросов. Среднее время ответа скрывает проблемы: если 1% запросов занимает 5 секунд, средняя может оставаться красивой. p99 показывает реальное «плохое» поведение системы под нагрузкой.

Что делать, если платформа персонализации недоступна?

Грамотная архитектура интеграции предполагает graceful degradation: при недоступности API персонализации сайт показывает бестселлеры или кешированные рекомендации вместо ошибки. Задержка ответа должна быть ограничена таймаутом (обычно 200–500 мс), после которого возвращается fallback.

Gravity Field

Персонализация для e-commerce — на одной платформе

Gravity Field помогает онлайн-ритейлерам растить конверсию, средний чек и удержание за счёт персонализации на всех этапах пути покупателя — без перегрузки IT.

✦Товарные рекомендации и merchandising-правила

✦A/B-тесты с байесовской статистикой и автопилотом (MAB)

✦Персонализация контента, PLP и сегментация аудитории

✦AI Shopping Assistant с доказанным ростом выручки на визит

Запросить демо →

SLA

Ключевые параметры SLA

Graceful Degradation при нарушении SLA

SLA и распродажи

Частые вопросы

Персонализация для e-commerce — на одной платформе

Связанные термины

Мы получили вашу заявку