Минимальный детектируемый эффект

Minimum Detectable Effect · минимальный детектируемый эффект · minimum detectable effect · MDE

Определение

MDE — наименьший прирост метрики, который спланированный A/B-тест в состоянии зафиксировать с заданными уровнями значимости (α) и мощности (1−β).

Что такое MDE и как он связан с другими параметрами

MDE — не произвольный порог, а математически связанная с тремя другими параметрами теста величина:

Параметры теста:
α (уровень значимости) — обычно 0.05
β (вероятность ошибки 2-го рода) — обычно 0.20
1-β (мощность теста) — обычно 0.80
Baseline CR — текущая конверсия

Из этих параметров выводится:
n (размер выборки) ↔ MDE

Если фиксированы α, β и трафик (→ n), то MDE определяется однозначно. Если фиксированы α, β и желаемый MDE — определяется требуемый n.

Как MDE влияет на длительность теста

Baseline CR = 2.0%, α = 0.05, β = 0.20

MDE = 20% (CR с 2.0% до 2.4%):  n ≈ 5 000 на группу
MDE = 10% (CR с 2.0% до 2.2%):  n ≈ 20 000 на группу
MDE = 5%  (CR с 2.0% до 2.1%):  n ≈ 80 000 на группу

При трафике 5 000 уникальных в день и split 50/50:
— MDE 20% → тест готов примерно за 2 дня (плюс минимум 14 дней на полный цикл)
— MDE 5% → тест потребует 32+ дней только по объёму выборки

Совет: не выбирайте MDE «как можно меньше» — это ловушка. Задайте вопрос: «Какой минимальный прирост конверсии обоснует внедрение этого изменения?» Этот прирост и есть ваш MDE.

Практическое применение

Ситуация	Рекомендуемый MDE
Главная страница, высокий трафик	5–10%
Карточка товара, средний трафик	10–15%
Страница категории, низкий трафик	15–25%
Рекомендательный виджет (по RPV)	5–10%

Типичные ошибки

Занижение MDE без расчёта трафика — тест растянется на месяцы, данные устареют
MDE ниже экономически значимого порога — даже при значимом результате внедрение не окупится
Игнорирование MDE при peeking — досрочная остановка при видимом эффекте ниже MDE даёт ложноположительный результат

Частые вопросы

Как выбрать MDE для теста?

Исходите из бизнес-ценности: какой минимальный прирост метрики оправдывает внедрение изменения? Если ROI от роста конверсии на 5% покрывает затраты на разработку — это ваш MDE. Не выбирайте MDE меньше, чем экономически значимый порог.

Какой MDE разумен для e-commerce?

Для конверсионных тестов на хорошо посещаемых страницах — 5–10% относительного прироста. Для A/B тестов рекомендательных алгоритмов — 3–7% по выручке на посетителя. Меньше 3% — тест потребует нескольких месяцев при типичном трафике.

Что произойдёт, если запустить тест с MDE выше реального эффекта?

Тест не сможет «увидеть» реальный эффект — он окажется ниже порога чувствительности. Результат будет «незначимым», хотя изменение на самом деле работает. Это ошибка второго рода (Type II Error), или false negative.

Gravity Field

MDE и планирование тестов в Gravity Field

Gravity Field помогает корректно планировать A/B тесты с учётом MDE, размера выборки и мощности теста, чтобы тест давал надёжные результаты.

✦Калькулятор размера выборки с настройкой α, β и MDE перед запуском теста

✦Байесовский подход снижает чувствительность к выбору MDE по сравнению с frequentist

✦Мониторинг накопленной выборки в реальном времени

✦Раннее предупреждение о недостаточном трафике для заданного MDE

Посмотреть функциональность →