Что такое Fine-tuning

Предобученная модель (LLM, энкодер для эмбеддингов, vision-модель) обучена на общих данных и обладает широкими знаниями. Fine-tuning — второй этап обучения на специализированной выборке. Цель: адаптировать модель к конкретной задаче, домену или стилю без обучения с нуля.

Это выгоднее по ресурсам: большая часть знаний уже «вшита» в веса из предобучения, нужно лишь «подправить» их под конкретный домен.

Варианты дообучения

Подход Описание Когда применять
Full fine-tuning Обновляются все веса модели Много данных, высокая специализация
LoRA / PEFT Обновляется малая доля весов Ограниченные вычислительные ресурсы
Instruction tuning Обучение на парах инструкция–ответ Изменение поведения и стиля
RLHF Обучение с подкреплением от людей-оценщиков Выравнивание с человеческими предпочтениями

Fine-tuning в e-commerce

Основные применения в ритейле:

AI Shopping Assistant: дообучение на исторических диалогах с покупателями и продуктовой документации позволяет модели использовать правильную терминологию, придерживаться тональности бренда и реже давать нерелевантные ответы.

Эмбеддинги товаров: fine-tuning мультиязычных энкодеров на парах (запрос → релевантный товар) улучшает качество семантического поиска и рекомендаций в специфичных категориях (мода, DIY, ювелирка).

Классификация намерений: точная настройка небольших классификаторов под категории намерений конкретного магазина.

Важно: fine-tuning — не замена RAG для обновляемых данных. Каталог меняется каждый день; вшивать его в веса модели нецелесообразно. RAG обновляет знания в реальном времени, fine-tuning меняет поведение и стиль модели.

Типичные ошибки

  • Catastrophic forgetting: дообучение на узком датасете может «вытеснить» общие знания модели. Решение — использовать PEFT или смешивать целевые данные с частью общих.
  • Переобучение на малой выборке: маленький датасет + много эпох = отличный результат на обучении и плохой на реальных запросах. Контролируй метрики на validation set.
  • Качество данных важнее объёма: зашумлённые или противоречивые примеры обучения ухудшают модель. Invest в аннотацию, не в количество.