L'ancrage est une technique qui vous permet de générer des réponses de modèle plus fiables, utiles et factuelles. Lorsque vous ancrez les réponses d'un modèle d'IA générative, vous les connectez à des sources d'information vérifiables. Pour implémenter l'ancrage, vous devez généralement récupérer les données sources pertinentes. Il est recommandé d'utiliser la technique de génération augmentée par récupération (RAG). La récupération est généralement effectuée à l'aide d'un moteur de recherche, qui utilise un index intégré aux significations sémantiques du texte source.
Il existe également des services et des API de composants qui implémentent le cycle de vie de la RAG, comme l'API Vertex AI Search Builder, qui permet de combiner des éléments. Avec la création mixte, vous pouvez implémenter une solution RAG à l'aide de l'un des services ou API suivants:
- API Grounding Generation : vous pouvez l'utiliser pour implémenter l'ancrage ou associer un fournisseur de récupération pour l'ensemble du cycle de vie de la RAG.
- Analyseur de mise en page de documents : cet analyseur représente le meilleur de Document AI et Gemini pour la compréhension des documents.
- Vertex AI Vector Search : ce service de recherche est très performant et utilise une base de données vectorielle de haute qualité.
- API Check Grounding : cette API compare la sortie RAG avec les faits récupérés et permet de s'assurer que toutes les déclarations sont fondées avant de renvoyer la réponse à l'utilisateur.
Étape suivante
- Pour en savoir plus sur l'IA responsable et les filtres de sécurité, consultez les bonnes pratiques d'IA responsable et les filtres de sécurité de Vertex AI.
- Pour en savoir plus sur l'implémentation de la RAG par LlamaIndex sur Vertex AI pour la RAG, consultez LlamaIndex sur Vertex AI pour la RAG.