Cette page a été traduite par l'API Cloud Translation.

Ancrer les réponses à l'aide de la RAG

L'ancrage est une technique qui vous permet de générer des réponses de modèle plus fiables, utiles et factuelles. Lorsque vous ancrez les réponses d'un modèle d'IA générative, vous les connectez à des sources d'information vérifiables. Pour implémenter l'ancrage, vous devez généralement récupérer les données sources pertinentes. Il est recommandé d'utiliser la technique de génération augmentée par récupération (RAG). La récupération est généralement effectuée à l'aide d'un moteur de recherche, qui utilise un index intégré aux significations sémantiques du texte source.

Il existe également des services et des API de composants qui implémentent le cycle de vie de la RAG, comme l'API Vertex AI Search Builder, qui permet de combiner des éléments. Avec la création mixte, vous pouvez implémenter une solution RAG à l'aide de l'un des services ou API suivants:

API Grounding Generation : vous pouvez l'utiliser pour implémenter l'ancrage ou associer un fournisseur de récupération pour l'ensemble du cycle de vie de la RAG.
Analyseur de mise en page de documents : cet analyseur représente le meilleur de Document AI et Gemini pour la compréhension des documents. Pour en savoir plus sur l'analyseur de mise en page, consultez Utiliser l'analyseur de mise en page.
Vertex AI Vector Search : ce service de recherche est très performant et utilise une base de données vectorielle de haute qualité.
API Check Grounding : cette API compare la sortie RAG avec les faits récupérés et permet de s'assurer que toutes les déclarations sont fondées avant de renvoyer la réponse à l'utilisateur.

Ancrer les réponses à l'aide du moteur RAG Vertex AI

Pour ancrer les réponses à l'aide du moteur RAG Vertex AI, vous devez créer une requête. Procédez comme suit :

Dans la console Google Cloud , accédez à la page Créer un prompt à l'aide de Vertex AI Studio.

Accéder à la page Créer une requête
Sélectionnez Ancrage : vos données.
Sélectionnez la source d'ancrage Moteur RAG.
Dans la liste Corpus, sélectionnez le nom de votre corpus.
Dans le champ Similarité top-K, sélectionnez 20 (valeur par défaut).
Cliquez sur Enregistrer.

Étapes suivantes

Pour en savoir plus sur l'IA responsable et les filtres de sécurité, consultez les bonnes pratiques d'IA responsable et les filtres de sécurité de Vertex AI.
Pour en savoir plus sur l'implémentation de la RAG par le moteur RAG, consultez Moteur RAG.