Choix de la base de données vectorielle dans le moteur de RAG Vertex AI
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Cette page présente les bases de données vectorielles compatibles avec le moteur RAG Vertex AI.
Vous pouvez également découvrir comment connecter une base de données vectorielle (magasin de vecteurs) à votre corpus RAG.
Les bases de données vectorielles jouent un rôle essentiel dans la récupération pour les applications RAG.
Les bases de données vectorielles offrent un moyen spécialisé de stocker et d'interroger les embeddings vectoriels, qui sont des représentations mathématiques de texte ou d'autres données qui capturent la signification et les relations sémantiques. Les embeddings vectoriels permettent aux systèmes RAG de trouver rapidement et précisément les informations les plus pertinentes dans une vaste base de connaissances, même lorsqu'il s'agit de requêtes complexes ou nuancées. Combinées à un modèle d'embedding, les bases de données vectorielles peuvent aider à surmonter les limites des LLM et à fournir des réponses plus précises, pertinentes et complètes.
Bases de données vectorielles compatibles
Lorsque vous créez un corpus RAG, le moteur RAG Vertex AI propose RagManagedDb, une base de données vectorielle adaptée aux entreprises, comme base de données vectorielle par défaut. Aucune gestion ni aucun provisionnement supplémentaires ne sont nécessaires.
RagManagedDb propose des options de recherche KNN et ANN, et permet de passer à un niveau de base pour un prototypage et une expérimentation rapides.
Pour en savoir plus sur le choix d'une stratégie de récupération sur RagManagedDb ou pour mettre à jour le niveau, consultez Utiliser RagManagedDb avec RAG. Pour que le moteur RAG Vertex AI crée et gère automatiquement la base de données vectorielle pour vous, consultez Créer un corpus RAG.
En plus de RagManagedDb par défaut, le moteur RAG Vertex AI vous permet de provisionner et d'utiliser votre base de données vectorielle dans votre corpus RAG. Dans ce cas, vous êtes responsable du cycle de vie et de la scalabilité de votre base de données vectorielle.
Comparer les options de base de données vectorielles
Ce tableau liste les bases de données vectorielles compatibles avec le moteur RAG Vertex AI et fournit des liens vers des pages expliquant comment utiliser ces bases de données dans votre corpus RAG.
Base de données vectorielle
Avantages
Recommandé pour
Inconvénients
Métriques de distance acceptées
Type de recherche
Étape de lancement
RagManagedDb (par défaut) est un service de base de données évolutif distribué à l'échelle régionale. Il offre une cohérence et une disponibilité très élevées, et peut être utilisé pour la recherche vectorielle.
easy simple fast quick
Aucune configuration n'est requise.
Convient aux cas d'utilisation à l'échelle de l'entreprise et à petite échelle.
Très grande cohérence.
Haute disponibilité.
Latence faible.
Excellente pour les charges de travail transactionnelles.
CMEK activé.
Génération de documents à fort volume.
Créer un système RAG à l'échelle de l'entreprise.
Développer une démonstration de faisabilité rapide.
Faibles coûts de provisionnement et de maintenance.
Utilisation avec des chatbots
Créer des applications RAG
Pour un rappel optimal, la fonctionnalité ANN exige que l'index soit reconstruit après des modifications majeures apportées à vos données.
cosine
KNN (par défaut) et ANN
Disponibilité générale
Vector Search est le service de base de données vectorielles de Vertex AI, optimisé pour les tâches de machine learning.
S'intègre à d'autres services Google Cloud .
L'évolutivité et la fiabilité sont assurées par l'infrastructure Google Cloud .
Utilise la tarification au paiement à l'usage.
Génération de documents à fort volume.
Créer un système RAG à l'échelle de l'entreprise.
Gérer l'infrastructure de la base de données vectorielle.
Clients Google Cloud existants ou toute personne souhaitant utiliser plusieurs Google Cloud services.
Les modifications ne sont pas immédiatement prises en compte.
Dépendance vis-à-vis d'un fournisseur avec Google Cloud.
Peut s'avérer plus coûteux selon vos cas d'utilisation.
cosine
dot-product
ANN
Disponibilité générale
Vertex AI Feature Store est un service géré permettant d'organiser, de stocker et de diffuser des caractéristiques de machine learning.
Il s'intègre à Vertex AI et à d'autres services Google Cloud .
L'évolutivité et la fiabilité sont assurées par l'infrastructure Google Cloud .
Exploite l'infrastructure BigQuery existante.
Génération de documents à fort volume.
Créer un système RAG à l'échelle de l'entreprise.
Gérer l'infrastructure de la base de données vectorielle.
Clients existants Google Cloud ou clients souhaitant utiliser plusieurs Google Cloud services.
Les modifications ne sont disponibles dans la boutique en ligne qu'après une synchronisation manuelle.
Dépendance vis-à-vis d'un fournisseur avec Google Cloud.
cosine
dot-product
L2 squared
ANN
Aperçu
Weaviate est une base de données vectorielle Open Source, flexible et modulaire.
Compatible avec différents types de données et offrant des fonctionnalités de graphiques intégrées.
Fournit une plate-forme Open Source et une communauté dynamique.
Très flexible et personnalisable.
Compatible avec différents types de données et modules pour différentes modalités, comme le texte et les images.
Vous pouvez choisir parmi les fournisseurs de services cloud, tels que Google Cloud, AWS et Azure.
Génération de documents à fort volume.
Créer un système RAG à l'échelle de l'entreprise.
Gérer l'infrastructure de la base de données vectorielle.
Clients Weaviate existants
Les modifications ne sont pas immédiatement prises en compte.
Peut être plus complexe à configurer et à gérer.
Les performances peuvent varier en fonction de la configuration.
cosine
dot-product
L2 squared
hamming
manhattan
Compatibilité avec les réseaux neuronaux artificiels et la recherche hybride
Aperçu
Pinecone est une base de données vectorielles native dans le cloud et entièrement gérée, conçue pour une recherche de similarités hautes performances.
Lancez-vous rapidement.
Excellente évolutivité et excellentes performances.
Concentrez-vous sur la recherche vectorielle avec des fonctionnalités avancées telles que le filtrage et la recherche de métadonnées.
Vous pouvez choisir parmi les fournisseurs de services cloud, tels que Google Cloud, AWS et Azure.
Génération de documents à fort volume.
Créer un système RAG à l'échelle de l'entreprise.
Gérer l'infrastructure de la base de données vectorielle.
Clients Pinecone existants.
Les modifications ne sont pas immédiatement prises en compte.
Peut s'avérer plus coûteux que d'autres options.
Les quotas et les limites restreignent l'échelle et les performances.
Contrôle limité sur l'infrastructure sous-jacente.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Vector database choices in Vertex AI RAG Engine\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page introduces the vector databases supported on Vertex AI RAG Engine.\nYou can also see how to connect a vector database (vector store) to your RAG\ncorpus.\n\nVector databases play a crucial role in enabling retrieval for RAG applications.\nVector databases offer a specialized way to store and query vector embeddings,\nwhich are mathematical representations of text or other data that capture\nsemantic meaning and relationships. Vector embeddings allow RAG systems to\nquickly and accurately find the most relevant information within a vast\nknowledge base, even when dealing with complex or nuanced queries. When combined\nwith an embedding model, vector databases can help overcome the limitations of\nLLMs, and provide more accurate, relevant, and comprehensive responses.\n\nSupported vector databases\n--------------------------\n\nWhen creating a RAG corpus, Vertex AI RAG Engine offers the\nenterprise-ready `RagManagedDb` as the default vector database, which requires\nno additional provisioning or managing.\n`RagManagedDb` offers both KNN and ANN search options and\nallows switching to a basic tier for some quick prototyping and experimentation.\nTo learn more about choosing a retrieval strategy on `RagManagedDb` or for\nupdating the tier, see [Use `RagManagedDb` with\nRAG](/vertex-ai/generative-ai/docs/rag-engine/use-ragmanageddb-with-rag). For\nVertex AI RAG Engine to automatically create and manage the\nvector database for you, see [Create a RAG\ncorpus](/vertex-ai/generative-ai/docs/model-reference/rag-api#create-a-rag-corpus-params-api).\n\nIn addition to the default `RagManagedDb`, Vertex AI RAG Engine\nlets you provision and use your vector database within your RAG corpus. In this\ncase, you are responsible for the lifecycle and scalability of your vector\ndatabase.\n\nCompare vector database options\n-------------------------------\n\nThis table lists your choices of vector databases that are supported within\nVertex AI RAG Engine and provides links to pages that explain how\nto use the vector databases within your RAG corpus. \n\nWhat's next\n-----------\n\n- To create a RAG corpus, see [Create a RAG corpus\n example](/vertex-ai/generative-ai/docs/model-reference/rag-api#create-a-rag-corpus-example-api).\n- To list all of the RAG corpora, see [List RAG corpora\n example](/vertex-ai/generative-ai/docs/model-reference/rag-api#list-rag-corpora-example-api)."]]