🤖 AI / ML

Обучение без учителя

Unsupervised Learning · unsupervised learning · несмотрённое обучение

Определение

Обучение без учителя — тип машинного обучения, при котором модель выявляет структуры, кластеры или представления в данных без использования размеченных целевых значений.

Суть обучения без учителя

В большинстве e-commerce задач данные не размечены: у нас есть миллионы событий — просмотры, добавления в корзину, покупки — но нет явного «ответа» на вопрос «какой сегмент этот пользователь?» или «аномальна ли эта транзакция?». Обучение без учителя находит скрытую структуру в таких данных самостоятельно.

Три главные задачи

Кластеризация — разбивает объекты на группы с высоким внутренним сходством. Покупатели с похожим поведением попадают в один кластер. Результат — аудиторные сегменты, которым можно назначить разные стратегии.

Снижение размерности — сжимает высокоразмерные данные (например, вектор покупок из 50 000 товаров) до компактного представления (10–50 признаков). Алгоритмы: PCA, t-SNE, UMAP, автоэнкодеры. Применяется для визуализации сегментов и предобработки перед обучением.

Обнаружение аномалий — выявляет точки, не вписывающиеся в общую структуру. В e-commerce — мошеннические заказы, накрутка отзывов, бот-трафик.

Применение в сегментации аудиторий

Кластеризация по RFM (Recency, Frequency, Monetary) — классический пример. Алгоритм k-means (или DBSCAN, если кластеры нестандартной формы) делит покупателей на сегменты без заранее заданных правил:

Кластер 1: высокая F, высокая M → VIP-покупатели
Кластер 2: высокая R, низкая F → новые покупатели
Кластер 3: низкая R, была высокая F → риск оттока

Результат — сегменты, которые можно использовать для персонализации контента, триггерных коммуникаций и разных офферов.

Совет: результаты кластеризации нужно интерпретировать вручную. Алгоритм найдёт группы — но назвать их («лояльные», «отток», «новые») должен аналитик. Без бизнес-интерпретации кластеры остаются просто цифрами.

Частые вопросы

Чем обучение без учителя отличается от обучения с учителем?

При обучении с учителем у каждого примера есть правильный ответ (метка): товар куплен или нет, пользователь отток или нет. Алгоритм учится предсказывать этот ответ. При обучении без учителя меток нет — алгоритм ищет скрытые структуры самостоятельно, исходя только из исходных данных.

Какие задачи решает обучение без учителя в e-commerce?

Кластеризация покупателей по поведению и RFM — для создания аудиторных сегментов. Построение тематических кластеров товаров — для улучшения навигации и рекомендаций. Обнаружение аномалий — мошеннические транзакции или боты. Снижение размерности эмбеддингов для визуализации и ускорения поиска.

Что такое k-means и когда его использовать?

K-means — простейший алгоритм кластеризации. Делит данные на K кластеров, минимизируя сумму расстояний от точек до центроидов своего кластера. Подходит для сегментации покупателей по числовым признакам (RFM, средний чек, частота). Ограничение — предполагает шарообразные кластеры одинакового размера, что не всегда верно для реальных аудиторий.

Gravity Field

Персонализация для e-commerce — на одной платформе

Gravity Field помогает онлайн-ритейлерам растить конверсию, средний чек и удержание за счёт персонализации на всех этапах пути покупателя — без перегрузки IT.

✦Товарные рекомендации и merchandising-правила

✦A/B-тесты с байесовской статистикой и автопилотом (MAB)

✦Персонализация контента, PLP и сегментация аудитории

✦AI Shopping Assistant с доказанным ростом выручки на визит

Запросить демо →