Что такое Fine-tuning
Предобученная модель (LLM, энкодер для эмбеддингов, vision-модель) обучена на общих данных и обладает широкими знаниями. Fine-tuning — второй этап обучения на специализированной выборке. Цель: адаптировать модель к конкретной задаче, домену или стилю без обучения с нуля.
Это выгоднее по ресурсам: большая часть знаний уже «вшита» в веса из предобучения, нужно лишь «подправить» их под конкретный домен.
Варианты дообучения
| Подход | Описание | Когда применять |
|---|---|---|
| Full fine-tuning | Обновляются все веса модели | Много данных, высокая специализация |
| LoRA / PEFT | Обновляется малая доля весов | Ограниченные вычислительные ресурсы |
| Instruction tuning | Обучение на парах инструкция–ответ | Изменение поведения и стиля |
| RLHF | Обучение с подкреплением от людей-оценщиков | Выравнивание с человеческими предпочтениями |
Fine-tuning в e-commerce
Основные применения в ритейле:
AI Shopping Assistant: дообучение на исторических диалогах с покупателями и продуктовой документации позволяет модели использовать правильную терминологию, придерживаться тональности бренда и реже давать нерелевантные ответы.
Эмбеддинги товаров: fine-tuning мультиязычных энкодеров на парах (запрос → релевантный товар) улучшает качество семантического поиска и рекомендаций в специфичных категориях (мода, DIY, ювелирка).
Классификация намерений: точная настройка небольших классификаторов под категории намерений конкретного магазина.
Важно: fine-tuning — не замена RAG для обновляемых данных. Каталог меняется каждый день; вшивать его в веса модели нецелесообразно. RAG обновляет знания в реальном времени, fine-tuning меняет поведение и стиль модели.
Типичные ошибки
- Catastrophic forgetting: дообучение на узком датасете может «вытеснить» общие знания модели. Решение — использовать PEFT или смешивать целевые данные с частью общих.
- Переобучение на малой выборке: маленький датасет + много эпох = отличный результат на обучении и плохой на реальных запросах. Контролируй метрики на validation set.
- Качество данных важнее объёма: зашумлённые или противоречивые примеры обучения ухудшают модель. Invest в аннотацию, не в количество.