🤖 AI / ML

Регуляризация

Regularization · L1 · L2 · Lasso · Ridge · dropout

Определение

Регуляризация — добавление штрафного члена к функции потерь за большие значения параметров модели, ограничивающее сложность решения и снижающее переобучение.

Проблема, которую решает регуляризация

Машинное обучение оптимизирует функцию потерь на тренировочной выборке. Без ограничений модель стремится минимизировать ошибку до нуля — и начинает «заучивать» тренировочные данные вместо того, чтобы находить обобщающие паттерны. На новых данных такая модель работает плохо: переобучение.

Регуляризация добавляет штраф за сложность модели прямо в функцию потерь:

Loss_total = Loss_data + λ × Penalty(weights)

Параметр λ (lambda) контролирует баланс между точностью на трейне и простотой модели.

Основные методы

L1 регуляризация (Lasso):

Penalty = λ × Σ|wᵢ|

Создаёт разреженные модели — малозначимые веса обнуляются. Используется для автоматического отбора признаков.

L2 регуляризация (Ridge):

Penalty = λ × Σwᵢ²

Уменьшает все веса, не обнуляя. Более стабильна при мультиколлинеарности признаков.

Elastic Net: комбинация L1 и L2. Часто используется когда нужна и разреженность, и устойчивость.

Dropout (нейросети):

При обучении: отключить нейрон с вероятностью p (обычно 0.2–0.5)
При инференсе: все нейроны активны, веса масштабируются на (1-p)

Регуляризация в рекомендательных системах

Модель	Метод регуляризации	Зачем
Матричная факторизация (ALS, SVD)	L2 для пользовательских и товарных эмбеддингов	Предотвратить запоминание активных пользователей
Нейронные CF-модели	Dropout + L2	Обобщение на cold-start пользователей
Gradient Boosting (XGBoost, LightGBM)	L1/L2 + min_child_weight	Контроль глубины деревьев
Логистическая регрессия в ранжировании	L1 или Elastic Net	Отбор релевантных признаков

Совет: в рекомендательных системах для e-commerce особенно важно регуляризировать эмбеддинги активных пользователей. Пользователи с тысячами покупок — «тяжёлые» примеры, которые модель склонна запомнить. Без регуляризации она хуже обобщается на обычных пользователей с 10–50 транзакциями.

Подбор гиперпараметра λ

Единственный правильный способ — кросс-валидация:

Разбить данные на train / validation / test.
Обучить модель с несколькими значениями λ (логарифмическая сетка: 0.001, 0.01, 0.1, 1.0, 10.0).
Выбрать λ с лучшей метрикой на validation.
Финально оценить на test — один раз.

Никогда не подбирать λ по test set — это утечка данных.

Частые вопросы

Чем L1 регуляризация отличается от L2?

L1 (Lasso) добавляет штраф, пропорциональный сумме абсолютных значений весов. Это приводит к разреженности: малозначимые веса становятся ровно нулевыми, фактически отбирая признаки. L2 (Ridge) штрафует за квадраты весов — уменьшает все веса равномерно, не обнуляя их. L1 используют когда нужна автоматическая отборка признаков, L2 — когда все признаки потенциально полезны.

Как выбрать коэффициент регуляризации?

Коэффициент λ (lambda) контролирует силу штрафа. При λ→0 регуляризации нет (риск переобучения). При λ→∞ модель слишком упрощена (недообучение). Подбирается через кросс-валидацию: пробуют несколько значений λ на validation set и выбирают то, при котором метрика на holdout максимальна.

Что такое Dropout и как он связан с регуляризацией?

Dropout — техника регуляризации для нейронных сетей: при каждой итерации обучения случайно отключается доля нейронов (обычно 20–50%). Это предотвращает co-adaptation — ситуацию, когда нейроны «сговариваются» и вместе запоминают тренировочные примеры. Интуиция: модель учится при ненадёжных компонентах, что вынуждает её к более устойчивым представлениям.

Зачем регуляризация важна именно в рекомендательных системах?

Рекомендательные модели (матричная факторизация, нейронные сети) работают с разреженными данными: большинство пользователей взаимодействовали лишь с малой долей каталога. Без регуляризации модель переобучается на «активных» пользователях с большой историей и плохо работает для остальных — а таких большинство.

Gravity Field

Персонализация для e-commerce — на одной платформе

Gravity Field помогает онлайн-ритейлерам растить конверсию, средний чек и удержание за счёт персонализации на всех этапах пути покупателя — без перегрузки IT.

✦Товарные рекомендации и merchandising-правила

✦A/B-тесты с байесовской статистикой и автопилотом (MAB)

✦Персонализация контента, PLP и сегментация аудитории

✦AI Shopping Assistant с доказанным ростом выручки на визит

Запросить демо →