Qu'est-ce que la génération augmentée de récupération (RAG) ?

La RAG (génération augmentée de récupération) est un framework d'IA qui combine les points forts des systèmes traditionnels de récupération d'informations (tels que les bases de données) avec les capacités des grands modèles de langage génératifs (LLM).En combinant ces connaissances supplémentaires avec ses propres compétences linguistiques, l'IA peut écrire un texte plus précis, à jour et adapté à vos besoins spécifiques.

Ancrage pour Gemini avec Vertex AI Search et DIY RAG

Comment fonctionne la génération augmentée de récupération ?

Les RAG s'appuient sur quelques étapes principales pour améliorer les résultats de l'IA générative :

  • Récupération et prétraitement : les RAG exploitent de puissants algorithmes de recherche pour interroger des données externes, tels que des pages Web, des bases de connaissances et des bases de données. Une fois récupérées, les informations pertinentes font l'objet d'un prétraitement, y compris la tokenisation, la recherche de radical et la suppression des mots vides.
  • Génération : les informations récupérées prétraitées sont ensuite intégrées de manière transparente au LLM pré-entraîné. Cette intégration améliore le contexte du LLM en lui permettant de mieux comprendre le sujet. Ce contexte amélioré permet au LLM de générer des réponses plus précises, informatives et plus engageantes.

Le processus RAG consiste d'abord à récupérer des informations pertinentes dans une base de données à l'aide d'une requête générée par le LLM. Les informations ainsi récupérées sont ensuite intégrées à la requête saisie par le LLM, ce qui lui permet de générer un texte plus précis et plus pertinent d'un point de vue contextuel. La RAG exploite des bases de données vectorielles, qui stockent les données d'une manière qui facilite la recherche et la récupération efficaces.

Pourquoi utiliser la RAG ?

La RAG offre plusieurs avantages par rapport aux méthodes traditionnelles de génération de texte, en particulier lorsqu'il s'agit d'informations factuelles ou de réponses basées sur les données. Voici quelques raisons clés pour lesquelles l'utilisation de la RAG peut être bénéfique :

Accès à des informations mises à jour

Les LLM traditionnels se limitent souvent à leurs connaissances et données pré-formées. Cela peut entraîner des réponses potentiellement obsolètes ou inexactes. La RAG résout ce problème en autorisant les LLM à accéder à des sources d'informations externes, ce qui garantit des réponses précises et à jour.

Ancrage factuel

Les LLM sont de puissants outils permettant de générer du texte créatif et attrayant, mais ils peuvent parfois avoir du mal à fournir des informations factuelles. En effet, les LLM sont entraînés sur d'énormes quantités de données textuelles, qui peuvent contenir des inexactitudes ou des biais.

La RAG aide à résoudre ce problème en fournissant aux LLM l'accès à une base de connaissances organisée, afin de s'assurer que le texte généré est fondé sur des informations factuelles. La RAG est donc particulièrement utile pour les applications pour lesquelles la précision est primordiale, telles que la diffusion d'actualités, la rédaction scientifique ou le service client.

Remarque : La RAG peut également aider à éviter l'envoi d'hallucinations à l'utilisateur final. Le LLM générera toujours des solutions de temps en temps lorsque son entraînement est incomplet, mais la technique RAG aide à améliorer l'expérience utilisateur.

Pertinence contextuelle

Le mécanisme de récupération dans la RAG garantit que les informations récupérées sont pertinentes pour la requête ou le contexte d'entrée.

En fournissant au LLM des informations contextuellement pertinentes, la RAG aide le modèle à générer des réponses plus cohérentes et adaptées au contexte donné.

Cette approche contextuelle permet de réduire le nombre de réponses non pertinentes ou hors sujet.

Cohérence factuelle

La RAG encourage le LLM à générer des réponses cohérentes avec les informations factuelles récupérées.

En conditionnant le processus de génération sur les connaissances récupérées, la RAG aide à minimiser les contradictions et les incohérences dans le texte généré.

Cela favorise la cohérence factuelle et réduit la probabilité de générer des informations fausses ou trompeuses.

Utilise des bases de données vectorielles

Les RAG exploitent les bases de données vectorielles pour récupérer efficacement les documents pertinents. Les bases de données vectorielles stockent les documents sous forme de vecteurs dans un espace de grande dimension, ce qui permet une récupération rapide et précise basée sur la similarité sémantique.

Meilleure précision des réponses

Les RAG complètent les LLM en leur fournissant des informations contextuellement pertinentes. Les LLM peuvent ensuite utiliser ces informations pour générer des réponses plus cohérentes, informatives et précises, même des réponses multimodales.

RAG et chatbots

Les RAG peuvent être intégrées à un système de chatbot pour améliorer leurs capacités de conversation. En accédant à des informations externes, les chatbots optimisés par RAG contribuent à exploiter les connaissances externes pour fournir des réponses plus complètes, plus informatives et contextuelles, améliorant ainsi l'expérience utilisateur globale.

Passez à l'étape suivante

Profitez de 300 $ de crédits gratuits et de plus de 20 produits Always Free pour commencer à créer des applications sur Google Cloud.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
  • Faites des économies grâce à notre approche transparente concernant la tarification
  • Le paiement à l'usage de Google Cloud permet de réaliser des économies automatiques basées sur votre utilisation mensuelle et des tarifs réduits pour les ressources prépayées. Contactez-nous dès aujourd'hui afin d'obtenir un devis.
Google Cloud