Cette page a été traduite par l'API Cloud Translation.

Présentation du moteur RAG Vertex AI

Cette page décrit le moteur RAG Vertex AI et son fonctionnement.

Présentation

Le moteur RAG Vertex AI, qui fait partie de la plate-forme Vertex AI, facilite la génération augmentée par récupération (RAG). Le moteur RAG de Vertex AI est également un framework de données permettant de développer des applications de grand modèle de langage (LLM) augmentées par le contexte. L'augmentation par le contexte se produit lorsque vous appliquez un LLM à vos données. Cette approche implémente la génération augmentée par récupération (RAG).

Un problème courant avec les LLM est qu'ils ne comprennent pas les connaissances privées, c'est-à-dire les données de votre organisation. Avec le moteur Vertex AI RAG, vous pouvez enrichir le contexte LLM avec des informations privées supplémentaires, car le modèle peut réduire les hallucinations et répondre aux questions plus précisément.

En combinant des sources de connaissances supplémentaires aux connaissances existantes des LLM, un meilleur contexte est fourni. Le contexte amélioré ainsi que la requête améliorent la qualité de la réponse du LLM.

L'image suivante illustre les concepts clés pour comprendre le moteur RAG de Vertex AI.

Concepts clés de la RAG Vertex AI

Ces concepts sont listés dans l'ordre du processus de génération augmentée par récupération (RAG).

Ingestion de données : intégrez des données provenant de différentes sources. Par exemple, fichiers locaux, Cloud Storage et Google Drive.
Transformation des données : conversion des données en préparation pour l'indexation. Par exemple, les données sont divisées en blocs.
Embedding (ou "plongement") : représentations numériques de mots ou de textes. Ces nombres capturent la signification sémantique et le contexte du texte. Les mots ou textes similaires ou connexes ont tendance à avoir des embeddings similaires, ce qui signifie qu'ils sont plus proches les uns des autres dans l'espace vectoriel de grande dimension.
Indexation des données: le moteur RAG Vertex AI crée un index appelé corpus. L'index structure la base de connaissances afin qu'il soit optimisé pour la recherche. Par exemple, l'index s'apparente à une table des matières détaillée pour un immense livre de référence.
Récupération: lorsqu'un utilisateur pose une question ou fournit une requête, le composant de récupération du moteur de RAG Vertex AI effectue une recherche dans sa base de connaissances afin de trouver des informations pertinentes pour la requête.
Génération: les informations récupérées deviennent le contexte ajouté à la requête utilisateur d'origine pour guider le modèle d'IA générative afin de générer des réponses ancrées sur des faits et pertinentes.

Régions où le service est disponible

Vertex AI RAG Engine est disponible dans les régions suivantes:

Région	Emplacement	Description	Étape de lancement
`europe-west3`	Francfort, Allemagne	Les versions `v1` et `v1beta1` sont compatibles.	DG
`us-central1`	Iowa	Les versions `v1` et `v1beta1` sont compatibles.	DG

Envoyer des commentaires

Pour discuter avec l'assistance Google, accédez au groupe d'assistance du moteur RAG Vertex AI.

Pour envoyer un e-mail, utilisez l'adresse e-mail vertex-ai-rag-engine-support@google.com.

Étape suivante

Pour savoir comment utiliser le SDK Vertex AI pour exécuter des tâches du moteur RAG Vertex AI, consultez le guide de démarrage rapide du RAG pour Python.
Pour en savoir plus sur l'ancrage, consultez la section Présentation de l'ancrage.
Pour en savoir plus sur les différences entre le RAG et l'ancrage, consultez la section Ancrer les réponses à l'aide du RAG.
Pour en savoir plus sur les réponses du RAG, consultez la section Récupération et sortie de génération du moteur RAG Vertex AI.
Pour en savoir plus sur l'architecture RAG :
- Infrastructure pour une application d'IA générative compatible avec RAG à l'aide de Vertex AI et de la recherche vectorielle
- Infrastructure pour une application d'IA générative compatible avec RAG à l'aide de Vertex AI et d'AlloyDB pour PostgreSQL