Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
L'ancrage est une technique qui vous permet de générer des réponses de modèle plus fiables, utiles et factuelles. Lorsque vous ancrez les réponses d'un modèle d'IA générative, vous les connectez à des sources d'information vérifiables. Pour implémenter l'ancrage, vous devez généralement récupérer les données sources pertinentes. Il est recommandé d'utiliser la technique de génération augmentée par récupération (RAG). La récupération est généralement effectuée à l'aide d'un moteur de recherche, qui utilise un index intégré aux significations sémantiques du texte source.
Il existe également des services et des API de composants qui implémentent le cycle de vie de la RAG, comme l'API Vertex AI Search Builder, qui permet de combiner des éléments. Avec la création mixte, vous pouvez implémenter une solution RAG à l'aide de l'un des services ou API suivants:
API Grounding Generation : vous pouvez l'utiliser pour implémenter l'ancrage ou associer un fournisseur de récupération pour l'ensemble du cycle de vie de la RAG.
Analyseur de mise en page de documents : cet analyseur représente le meilleur de Document AI et Gemini pour la compréhension des documents. Pour en savoir plus sur l'analyseur de mise en page, consultez Utiliser l'analyseur de mise en page.
Vertex AI Vector Search : ce service de recherche est très performant et utilise une base de données vectorielle de haute qualité.
API Check Grounding : cette API compare la sortie RAG avec les faits récupérés et permet de s'assurer que toutes les déclarations sont fondées avant de renvoyer la réponse à l'utilisateur.
Ancrer les réponses à l'aide du moteur RAG Vertex AI
Pour ancrer les réponses à l'aide du moteur RAG Vertex AI, vous devez créer une requête. Procédez comme suit :
Dans la console Google Cloud , accédez à la page Créer un prompt à l'aide de Vertex AI Studio.
Pour en savoir plus sur l'implémentation de la RAG par le moteur RAG, consultez Moteur RAG.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Ground responses using RAG\n\nGrounding is a technique that you can use to help produce model responses that\nare more trustworthy, helpful, and factual. When you ground generative AI model\nresponses, you connect them to verifiable sources of information. To implement\ngrounding, usually, you must retrieve relevant source data. The\nrecommended best practice is to use the retrieval-augmented generation (RAG)\ntechnique. Retrieval is usually done using a search engine, which uses an index\nthat's embedded with the semantic meanings of the source text.\n\nThere are also services and component APIs that implement the RAG lifecycle,\nsuch as the Vertex AI Search Builder API, which allows for mix-and-match\nbuilding. With mix-and-match building, you can implement a RAG solution using\nany of the following services or APIs:\n\n- **Grounding generation API**: You can use it to implement grounding, or link to a retrieval provider for the complete RAG lifecycle.\n- **Document layout parser** : This parser represents the best of Document AI and Gemini for document understanding. For more information about the layout parser, see [Use the layout parser](/vertex-ai/generative-ai/docs/rag-engine/layout-parser-integration#use-layout-parser).\n- **Vertex AI Vector Search**: This search service is highly performant and uses a high-quality vector database.\n- **Check grounding API**: This API compares RAG output with the retrieved facts and helps to ensure that all statements are grounded before returning the response to the user.\n\nGround responses using Vertex AI RAG Engine\n-------------------------------------------\n\nTo ground responses using Vertex AI RAG Engine, you must create a\nprompt. Do the following:\n\n1. In the Google Cloud console, go to the **Create prompt** page using\n Vertex AI Studio.\n\n [Go to Create prompt](https://console.cloud.google.com/vertex-ai/studio/multimodal)\n2. Select **Grounding: Your data**.\n\n3. Select **RAG Engine** grounding source.\n\n4. From the **Corpus** list, select your corpus name.\n\n5. In the **Top-K Similarity** field, select **20**, which is the default.\n\n6. Click **Save**.\n\nWhat's next\n-----------\n\n- To learn more about responsible AI and safety filters, see [responsible AI best practices and Vertex AI's safety filters](/vertex-ai/generative-ai/docs/learn/responsible-ai).\n- To learn more about how RAG is implemented by RAG Engine, see [RAG Engine](/vertex-ai/generative-ai/docs/rag-overview)."]]