🤖 AI / ML

Векторная база данных

Vector Database · vector store · векторное хранилище · Pinecone · Weaviate · Qdrant

Определение

Векторная база данных — специализированное хранилище, оптимизированное для индексации и поиска ближайших соседей в многомерных векторных пространствах с субсекундной латентностью.

Что такое векторная база данных

Векторная база данных хранит объекты в виде числовых векторов (эмбеддингов) и специализируется на одной задаче: быстро находить «наиболее похожие» объекты по заданному вектору-запросу.

Стандартная схема работы в e-commerce:

Товар → Модель эмбеддингов → Вектор [0.23, -0.41, 0.87, ...] → Векторная база
Запрос → Модель эмбеддингов → Вектор [0.21, -0.39, 0.85, ...] → ANN-поиск → Топ-20 товаров

Косинусное расстояние между векторами = мера семантической близости. Два вектора рядом в пространстве — два объекта «похожи» по смыслу, независимо от формулировок.

Зачем нужна специализированная база

Обычная реляционная база не подходит для поиска по сходству в высокоразмерных пространствах. При каталоге из миллиона товаров и векторах размерностью 768 точный перебор на каждый запрос занял бы секунды. Векторные базы используют специализированные индексы:

Индекс	Принцип	Когда применять
HNSW	Граф ближайших соседей	Высокая точность, умеренный объём
IVF	Кластеризация + поиск в кластере	Очень большие каталоги
PQ	Квантизация векторов	Экономия памяти

HNSW (Hierarchical Navigable Small World) — наиболее распространённый: обеспечивает поиск за <10 мс при recall >95%.

Применения в e-commerce

Семантический поиск. Запрос «тёплая куртка для горных походов» → эмбеддинг → поиск по каталогу описаний товаров. Релевантные результаты даже без совпадения ключевых слов.

Рекомендации «похожие товары». Эмбеддинг просмотренного товара → поиск ближайших соседей в пространстве товаров. Работает на холодных товарах без истории взаимодействий.

AI Shopping Assistant и RAG. LLM-ассистент получает контекст через retrieval — векторный поиск по базе описаний, спецификаций и FAQ товаров.

Совет: для гибридного поиска (векторная релевантность + ключевые слова + фильтры) выбирайте базы с нативной поддержкой гибридного режима (Weaviate, Qdrant) или используйте pgvector совместно с полнотекстовым поиском PostgreSQL.

Частые вопросы

Чем векторная база отличается от обычной реляционной?

Реляционная база (PostgreSQL, MySQL) ищет по точным значениям или диапазонам и плохо масштабируется на поиск по сходству в высокоразмерных пространствах. Векторная база хранит числовые представления объектов (эмбеддинги) и оптимизирована для ANN-поиска — поиска «наиболее похожих» за миллисекунды. Для задачи «найди 20 товаров, похожих на просмотренный» векторная база — единственный практичный выбор на больших каталогах.

Как векторная база используется в семантическом поиске?

Запрос пользователя и описания товаров проходят через одну и ту же модель эмбеддингов и превращаются в векторы. Векторная база находит товары с наименьшим косинусным расстоянием до вектора запроса. Это позволяет находить релевантные результаты даже при несовпадении ключевых слов — например, «удобная обувь для долгой ходьбы» → кроссовки для трейлраннинга.

Какие популярные векторные базы используются в e-commerce?

Qdrant (Rust, высокая производительность, open source), Pinecone (managed, простая интеграция), Weaviate (поддержка гибридного поиска), Milvus (масштабируемый, для больших каталогов), pgvector (расширение PostgreSQL — удобно, если уже используете Postgres). Выбор зависит от объёма каталога, требований к latency и инфраструктуры.

Что такое ANN и почему не используют точный поиск?

ANN (Approximate Nearest Neighbor) — приближённый поиск ближайших соседей. Точный поиск по всем эмбеддингам каталога требует O(n) вычислений на каждый запрос — при миллионе товаров и запросе каждые 100 мс это нереально. ANN-индексы (HNSW, IVF) жертвуют долями процента точности в обмен на поиск за O(log n) — десятки миллисекунд вместо секунд.

Gravity Field

Персонализация для e-commerce — на одной платформе

Gravity Field помогает онлайн-ритейлерам растить конверсию, средний чек и удержание за счёт персонализации на всех этапах пути покупателя — без перегрузки IT.

✦Товарные рекомендации и merchandising-правила

✦A/B-тесты с байесовской статистикой и автопилотом (MAB)

✦Персонализация контента, PLP и сегментация аудитории

✦AI Shopping Assistant с доказанным ростом выручки на визит

Запросить демо →

Векторная база данных

Что такое векторная база данных

Зачем нужна специализированная база

Применения в e-commerce

Популярные реализации

Частые вопросы

Персонализация для e-commerce — на одной платформе

Связанные термины

Мы получили вашу заявку