Vertex AI propose une suite d'API pour vous aider à créer vos propres applications de génération augmentée de récupération (RAG, Retrieval Augmented Generation) ou à créer votre propre moteur de recherche. Cette page présente ces API.
Récupération et génération
La génération augmentée par récupération est une méthodologie qui permet aux grands modèles de langage (LLM) de générer des réponses basées sur votre source de données de choix. La classification RAG comporte deux étapes:
- Récupération: il peut être courant de rencontrer des problèmes de recherche pour obtenir rapidement les faits les plus pertinents. Avec le RAG, vous pouvez rapidement récupérer les faits importants pour générer une réponse.
- Génération:le LLM utilise les faits récupérés pour générer une réponse fondée.
Vertex AI propose des options pour les deux étapes afin de répondre à différents besoins des développeurs.
Récupération
Choisissez la méthode de récupération la mieux adaptée à vos besoins:
Vertex AI Search:Vertex AI Search est un moteur de récupération d'informations de qualité Google Search qui peut être un composant de toute application d'IA générative qui utilise vos données d'entreprise. Vertex AI Search fonctionne comme un moteur de recherche sémantique et par mots clés prêt à l'emploi pour la RAG. Il peut traiter différents types de documents et dispose de connecteurs pour divers systèmes sources, y compris BigQuery et de nombreux systèmes tiers.
Pour en savoir plus, consultez Vertex AI Search.
Créez votre propre récupération:si vous souhaitez créer votre recherche sémantique, vous pouvez vous appuyer sur les API Vertex AI pour les composants de votre système RAG personnalisé. Cette suite d'API fournit des implémentations de haute qualité pour l'analyse de documents, la génération d'embeddings, la recherche vectorielle et le classement sémantique. L'utilisation de ces API de bas niveau vous offre une flexibilité totale dans la conception de votre récupérateur, tout en accélérant le délai de commercialisation et en offrant une qualité élevée en vous appuyant sur les API Vertex AI de bas niveau.
Pour en savoir plus, consultez la section Créer votre propre génération avec augmentation du Retrieval.
Ajouter une récupération existante:vous pouvez utiliser votre recherche existante comme outil de récupération pour la génération basée sur des données. Vous pouvez également utiliser les API Vertex pour le RAG afin d'améliorer la qualité de votre recherche existante.
LlamaIndex sur Vertex AI:LlamaIndex sur Vertex AI permet aux développeurs familiarisés avec ce framework logiciel Open Source (OSS) populaire de créer des récupérateurs à utiliser en production et dans un contexte d'entreprise.
Pour en savoir plus, consultez la page Présentation de LlamaIndex sur Vertex AI pour la RAG dans la documentation sur l'IA générative sur Vertex AI.
Recherche Google:lorsque vous utilisez l'ancrage avec la recherche Google pour votre modèle Gemini, Gemini utilise la recherche Google et génère une sortie ancrée aux résultats de recherche pertinents. Cette méthode de récupération ne nécessite aucune gestion, et vous avez accès à toutes les connaissances du monde pour Gemini.
Pour en savoir plus, consultez la section Ancrage avec la recherche Google dans la documentation sur l'IA générative sur Vertex AI.
Génération
Choisissez la méthode de génération la mieux adaptée à vos besoins:
API Grounded generation (GA avec liste d'autorisation) : utilisez l'API Grounded generation pour générer des réponses pertinentes à la requête d'un utilisateur. Cette API utilise un modèle Gemini spécialisé et affiné. Elle constitue un moyen efficace de réduire les hallucinations et de fournir des réponses basées sur vos sources, des sources tierces ou la recherche Google, y compris des références à du contenu d'aide d'ancrage.
Pour en savoir plus, consultez la section Générer des réponses étayées.
Gemini:Gemini est le modèle le plus performant de Google. Il offre une mise à la terre prête à l'emploi avec la recherche Google. Vous pouvez l'utiliser pour créer votre solution de génération de courant de terre entièrement personnalisée.
Pour en savoir plus, consultez la section Ancrage avec la recherche Google dans la documentation sur l'IA générative sur Vertex AI.
Model Garden:si vous souhaitez un contrôle total et le modèle de votre choix, vous pouvez utiliser n'importe lequel des modèles de Model Garden de Vertex AI pour la génération.
Créer votre propre génération augmentée de récupération
Le développement d'un système RAG personnalisé pour la mise à la terre offre une flexibilité et un contrôle à chaque étape du processus. Vertex AI propose une suite d'API pour vous aider à créer vos propres solutions de recherche. L'utilisation de ces API vous offre une flexibilité totale pour la conception de votre application RAG, tout en accélérant le délai de commercialisation et en offrant une qualité élevée en vous appuyant sur ces API Vertex AI de bas niveau.
L'analyseur de mise en page Document AI L'analyseur de mise en page Document AI transforme les documents de différents formats en représentations structurées, rendant accessible le contenu tel que les paragraphes, les tableaux, les listes et les éléments structurels tels que les titres, les en-têtes de page et les pieds de page, et crée des segments contextuels qui facilitent la récupération d'informations dans un éventail d'applications d'IA générative et de découverte.
Pour en savoir plus, consultez la section Analyseur de mise en page Document AI dans la documentation Document AI.
API Embeddings:les API d'embeddings Vertex AI vous permettent de créer des embeddings pour les entrées textuelles ou multimodales. Les embeddings sont des vecteurs de nombres à virgule flottante conçus pour capturer la signification de leur entrée. Vous pouvez utiliser les embeddings pour alimenter la recherche sémantique à l'aide de la recherche vectorielle.
Pour en savoir plus, consultez les sections Embeddings textuels et Embeddings multimodaux dans la documentation sur l'IA générative sur Vertex AI.
Vector Search Le moteur de récupération est un élément clé de votre application de recherche ou de RAG. Vertex AI Vector Search est un moteur de récupération qui peut effectuer des recherches dans des milliards d'éléments sémantiquement similaires ou présentant des relations sémantiques à grande échelle, avec un nombre élevé de requêtes par seconde (RPS), un taux de rappel élevé, une faible latence et une rentabilité maximisée. Il peut effectuer des recherches sur des embeddings denses, et est compatible avec la recherche par mot clé avec embeddings clairsemés et la recherche hybride en version Preview publique.
Pour en savoir plus, consultez la section Présentation de Vertex AI Vector Search dans la documentation Vertex AI.
L'API de classement L'API de classement reçoit une liste de documents et les réorganise en fonction de leur pertinence par rapport à une requête donnée. Par rapport aux représentations vectorielles continues qui ne tiennent compte que de la similarité sémantique d'un document et d'une requête, l'API de classement peut vous fournir un score plus précis sur la qualité de la réponse d'un document à une requête donnée.
Pour en savoir plus, consultez Classer et reclasser des documents.
API de génération avec ancrage Utilisez l'API de génération basée sur des faits pour générer des réponses pertinentes à la requête d'un utilisateur. Les sources d'ancrage peuvent être vos data stores Vertex AI Search, les données personnalisées que vous fournissez ou la recherche Google.
Pour en savoir plus, consultez Générer des réponses étayées.
API de vérification de l'ancrage L'API de vérification de l'ancrage détermine le niveau d'ancrage d'un texte donné dans un ensemble donné de textes de référence. L'API peut générer des citations à l'appui du texte de référence pour indiquer où le texte donné est étayé par les textes de référence. L'API peut être utilisée, entre autres, pour évaluer l'ancrage des réponses d'un système RAG. En outre, en tant que fonctionnalité expérimentale, l'API génère également des citations contradictoires qui indiquent les points de désaccord entre le texte donné et les textes de référence.
Pour en savoir plus, consultez Vérifier l'ancrage.
Workflow: générer des réponses fondées sur des données non structurées
Voici un workflow qui explique comment intégrer les API RAG Vertex AI pour générer des réponses ancrées à partir de données non structurées.
- Importez vos documents non structurés, tels que des fichiers PDF, des fichiers HTML ou des images avec du texte, dans un emplacement Cloud Storage.
- Traitez les documents importés à l'aide de l'analyseur de mise en page. L'analyseur de mise en page décompose les documents non structurés en segments et transforme le contenu non structuré en sa représentation structurée. L'analyseur de mise en page extrait également des annotations des segments.
- Créez des représentations vectorielles continues de texte pour les segments à l'aide de l'API d'embeddings de texte Vertex AI.
- Indexez et récupérez les embeddings de segments à l'aide de Vector Search.
- Classez les segments à l'aide de l'API de classement et déterminez les segments les mieux classés.
- Générez des réponses fondées sur les segments les mieux classés à l'aide de l'API Ground Generation.
Si vous avez généré les réponses à l'aide d'un modèle de génération de réponses autre que les modèles Google, vous pouvez vérifier l'ancrage de ces réponses à l'aide de la méthode de vérification de l'ancrage.