Concepts fondamentaux des agents d'IA

Les agents d'IA sont passés de chatbots passifs à des systèmes autonomes capables de raisonner, d'utiliser des outils d'entreprise et d'exécuter des workflows complexes.

Pour exploiter tout leur potentiel et passer des cas d'utilisation et des prototypes expérimentaux à des systèmes robustes de niveau entreprise qui génèrent un ROI mesurable, il est utile de comprendre les éléments de base. Nous allons ici décortiquer les concepts fondamentaux des agents d'IA, y compris :

  • Modèles  : moteur de raisonnement que l'agent utilise pour réfléchir
  • Ancrage  : la base de connaissances, qui devient le mécanisme d'exactitude factuelle et de récupération des connaissances
  • Outils  : capacités définies pour effectuer des tâches, qui déterminent ce qu'un agent peut faire
  • Architecture des données  : emplacement où l'agent stocke sa mémoire et ses données
  • Orchestration  : comment l'agent planifie et relie toutes les parties d'une tâche en plusieurs étapes
  • Environnement d'exécution  : où l'agent réside et s'exécute à grande échelle

Modèles

Considérez le modèle comme le cerveau de votre agent. Il lit et comprend vos requêtes, identifie les actions à effectuer et génère des réponses intelligentes.

Choisir le bon modèle, c'est trouver le juste équilibre entre les capacités, la vitesse et le coût pour votre cas d'utilisation. L'objectif n'est pas de maximiser la puissance brute, mais d'optimiser l'efficacité. L'erreur la plus courante consiste à surinvestir dans une fonctionnalité alors qu'un cas d'utilisation n'en a pas besoin, ce qui entraîne des dépenses inefficaces et des performances plus lentes.

Les architectures cognitives robustes utilisent plusieurs agents spécialisés qui sélectionnent de manière dynamique le modèle le plus simple pour leur sous-tâche spécifique. C'est comme avoir une équipe de spécialistes à portée de main, les tâches étant intelligemment attribuées à différents spécialistes en fonction de leur nature. Par exemple, un modèle puissant est réservé aux tâches complexes de planification et de raisonnement, tandis que les tâches plus simples et à volume élevé, comme la classification de l'intention de l'utilisateur, sont dirigées vers un modèle plus rapide et plus économique. Cet acheminement dynamique des modèles est essentiel pour optimiser à la fois les performances et les coûts.

En proposant un large éventail de modèles et des modes de raisonnement configurables, les développeurs disposent d'un ensemble dynamique de leviers pour une optimisation sophistiquée. Tout cela les aide à calibrer le coût et les performances d'un système multi-agent entier pour répondre à des besoins commerciaux et techniques spécifiques.

Une fois que vous avez sélectionné un modèle qui répond à vos besoins en termes de coût, de latence et de qualité, vous pouvez avoir la possibilité de l'affiner. Cette approche spécialise les connaissances et le style du modèle pour répondre à vos besoins métier spécifiques. Elle utilise un ensemble de données organisé contenant vos propres exemples de haute qualité. Pour savoir si un modèle autorise et prend en charge l'affinage, consultez sa documentation et son contrat de licence.

Présentation détaillée : Créer des agents d'entreprise

Prêt à mettre en pratique vos connaissances sur la sélection de modèles ? Découvrez comment équilibrer la sécurité, la fiabilité et l'efficacité au sein d'une architecture cognitive robuste.

Obtenez le guide technique pour créer des systèmes multi-agents d'entreprise.


Conseil de pro

Utilisez une plate-forme centralisée pour découvrir, personnaliser et déployer des modèles de fondation. Recherchez une plate-forme qui propose une sélection rigoureuse des meilleurs modèles au monde, vous permet de les déployer en un seul clic et offre une sécurité de niveau entreprise dès le départ.

Surface de référence

La crédibilité et l'utilité d'un agent dépendent de sa capacité à fournir des réponses exactes et fiables basées sur des faits vérifiables. C'est là qu'intervient l'ancrage. Il transforme les agents en véritables outils d'automatisation des workflows, profondément et précisément ancrés dans vos données d'entreprise.

Il existe trois couches d'ancrage à prendre en compte.

1. RAG : une première étape fondamentale

La crédibilité d'un agent est liée à sa capacité à fournir des réponses basées sur des faits vérifiables. La génération augmentée par récupération (RAG) connecte un agent à une source de données vérifiables en temps réel, ce qui garantit que l'agent agit sur la base de faits et non d'hallucinations.

Ce processus simple de récupération puis de génération peut être appliqué au texte, aux images et à d'autres types de données. Il permet d'effectuer des recherches ultra rapides dans des ensembles de données volumineux, ce qui permet de prendre des décisions réactives et opportunes.

Cependant, si le RAG permet de répondre à des questions, il n'est pas adapté aux requêtes complexes qui nécessitent une compréhension approfondie des relations entre les points de données.

2. GraphRAG : un ancrage plus intelligent

GraphRAG enrichit l'ancrage en comprenant les relations explicites entre les points de données dans un graphe de connaissances et en récupérant des données contextuelles qui reflètent mieux ses interconnexions avec d'autres sources de données. Ainsi, au lieu de simplement faire correspondre des expressions similaires, votre agent comprend les relations entre les concepts.

Surtout, les graphes de connaissances vous permettent de contrôler directement votre logique métier. Alors que la RAG standard s'appuie sur des modèles générés par le modèle, un Knowledge Graph vous permet de définir et de gérer les relations spécifiques entre les entités, ce qui garantit que l'agent respecte la taxonomie et les règles uniques de votre organisation. Pour une fiabilité maximale, les grandes entreprises utilisent une approche hybride qui combine la récupération étendue de la RAG standard avec la précision et le contrôle de GraphRAG.

Cas d'utilisation

Une vue structurée des données provenant de sources disparates

Les entreprises de services financiers utilisent les graphes de connaissances pour offrir aux analystes une vue unifiée des rapports d'analystes, des conférences sur les résultats, des évaluations des risques et plus encore. Ce réseau de données riche et interconnecté aide les analystes à découvrir des insights jusqu'alors cachés, comme des dépendances complexes dans la chaîne d'approvisionnement, des chevauchements dans les conseils d'administration de concurrents et une exposition à des risques géopolitiques complexes.

3. RAG agentique : raisonnement et récupération dynamiques

L'approche la plus efficace pour l'ancrage est le RAG agentique, dans lequel l'agent n'est plus un destinataire passif d'informations, mais un participant actif et raisonnant dans le processus de récupération lui-même. Avec la RAG agentique, un agent peut analyser une requête complexe, formuler un plan en plusieurs étapes et exécuter plusieurs appels d'outils de manière séquentielle pour trouver les meilleures informations possibles. Il ne s'agit pas de remplacer la recherche traditionnelle, mais plutôt d'ajouter un raisonnement avancé à votre infrastructure RAG et de graphe de connaissances existante pour résoudre les requêtes à plusieurs sauts.

Cette capacité à percevoir et à raisonner sur différents types de données transforme l'agent, qui passe du statut de processeur de données à celui d'outil de résolution de problèmes capable de comprendre le monde et d'interagir avec lui de manière plus complète. En permettant à l'agent d'être un participant actif et raisonnant, les développeurs peuvent créer des systèmes capables d'exécuter les requêtes complexes en plusieurs étapes et les tâches à long terme qui définissent les capacités agentiques de nouvelle génération.

Conseil de pro

Utilisez l'approche de récupération et de re-classement

Gérez le compromis entre le rappel (trouver tous les documents pertinents) et la précision (s'assurer que les documents récupérés sont pertinents) à l'aide de l'approche "récupérer et reclasser", qui élargit l'ouverture du rappel pour récupérer un ensemble de documents plus grand que nécessaire. Cet ensemble plus vaste est transmis au LLM ou à un service de reclassement spécialisé, qui identifie les documents les plus pertinents et écarte ceux qui ne le sont pas ou qui sont sémantiquement opposés.

Remarque

L'affinage n'est pas un ancrage. L'affinage adapte le style d'un modèle et affine ses connaissances sur une tâche spécifique. L'ancrage connecte le modèle à des sources de données vérifiables en temps réel pour s'assurer que ses réponses sont factuellement exactes.

Outils

Les outils sont des fonctionnalités définies qui permettent à un agent d'aller au-delà des fonctions natives de son modèle de raisonnement de base. Qu'il s'agisse d'effectuer un simple calcul interne ou d'interagir avec des systèmes externes à l'aide d'appels d'API, les outils comblent le fossé entre le raisonnement de l'agent et sa capacité à agir. L'ancrage étant le principal moyen dont dispose un agent pour récupérer de nouvelles informations, il s'agit techniquement de l'outil le plus fondamental de sa boîte à outils.

Outils possibles :

  • Fonctions et services internes  : logique propriétaire ou code spécialisé écrit par votre équipe pour résoudre des problèmes spécifiques à votre entreprise.
  • API externes : connexions sécurisées à des services tiers qui permettent à un agent d'exécuter des tâches dans le monde réel.
  • Récupération et ancrage des données : capacité à interroger dynamiquement des bases de données (y compris en convertissant le langage naturel en SQL), à rechercher des magasins de vecteurs ou à accéder à des bases de connaissances d'entreprise. Qu'il s'agisse d'une simple recherche ou d'une requête de base de données complexe, ces outils garantissent que les actions de l'agent sont basées sur des données vérifiables.
  • Collaboration entre agents  : dans les systèmes plus sophistiqués, un agent peut collaborer avec un autre agent spécialisé pour résoudre un problème. Bien qu'un agent puisse être utilisé comme un "outil" pour une tâche spécifique, les systèmes d'entreprise les plus performants les considèrent comme des collaborateurs qui coordonnent de manière sécurisée les actions dans différents domaines.

Architecture de données

Les agents utilisent différents types de mémoire pour différentes tâches. Une architecture de données d'entreprise robuste doit répondre à trois besoins distincts : un stockage persistant pour la récupération des connaissances à long terme, un accès à faible latence pour le contexte conversationnel à court terme et un registre durable pour l'audit transactionnel.

1. Base de connaissances à long terme (ancrage et mémoire)

La mémoire à long terme est le fondement de l'intelligence, de l'ancrage et de la personnalisation d'un agent. Elle se distingue du contexte rapide et à court terme d'une conversation en direct. Son architecture comporte trois composants principaux :

  • Une base de connaissances structurée pour la génération augmentée par récupération (RAG) basée sur des faits
  • Un magasin persistant pour la mémoire utilisateur distillée. Au lieu de stocker chaque interaction passée, l'agent génère et stocke des informations importantes sur l'utilisateur, l'équipe ou la tâche pour offrir une expérience continue et personnalisée.
  • Un lac de données opérationnel pour les données brutes telles que les transcriptions de conversations et les états de workflows, permettant des processus cognitifs plus complexes et des analyses futures

Cas d'utilisation

Accéder à toutes les informations pertinentes

Un agent juridique récupère instantanément la jurisprudence, les documents de politique interne et les manuels de formation pour générer une première ébauche de contrat conforme à la loi.

2. Mémoire de travail (contexte conversationnel et état à court terme)

Cette couche gère les informations transitoires (la fenêtre de contexte du LLM) nécessaires à une tâche ou une conversation en cours. Pour maintenir une expérience utilisateur réactive, il doit fournir un accès à très faible latence pour la séquence itérative d'actions et d'observations en cours.

Cas d'utilisation

Avoir une conversation utile

Un agent du service client maintient l'état d'un flux de dépannage en plusieurs étapes, en mémorisant les numéros de série ou les étapes de diagnostic précédemment fournis par l'utilisateur pour éviter les répétitions.

3. Mémoire transactionnelle (gestion des états et audit des actions)

Cette couche est chargée d'enregistrer les actions et les changements d'état avec une cohérence et une intégrité fortes. Il sert de système d'enregistrement durable, ce qui est essentiel du point de vue de la sécurité et pour fournir une piste d'audit non répudiable pour chaque action effectuée par un agent.

Cas d'utilisation

Tenir un registre durable

Un agent de la chaîne d'approvisionnement enregistre l'exécution réussie d'un bon de commande complexe impliquant plusieurs parties, ce qui permet de suivre et de vérifier la transaction de façon permanente dans les systèmes financiers.

Orchestration

L'orchestration est le cœur opérationnel qui guide un agent dans une tâche en plusieurs étapes. Pour tout processus nécessitant plus d'une action, il détermine les outils nécessaires, dans quel ordre et comment leurs sorties doivent être combinées pour atteindre un objectif final.

En tant que fonction exécutive de l'agent, l'orchestration est essentielle pour créer des systèmes sophistiqués qui automatisent des processus métier complexes. Elle vous permet de résoudre des problèmes qui n'étaient pas techniquement réalisables auparavant, et d'ouvrir la voie à une nouvelle catégorie d'applications et d'expériences utilisateur.

ReAct (raisonnement + action) est un modèle d'orchestration courant et efficace. Ce framework combine les capacités de raisonnement et d'action des grands modèles de langage, et établit une boucle dynamique à plusieurs tours dans laquelle le modèle génère à la fois des traces de raisonnement (pensées) et des actions spécifiques à la tâche de manière entrelacée.

Avec ReAct, le raisonnement aide le modèle à suivre et à mettre à jour les plans d'action, tandis que les actions collectent des informations à partir d'outils externes pour éclairer le processus de raisonnement. Voici comment cela fonctionne :

  1. Raisonnement : l'agent évalue l'objectif et l'état actuel, et formule une hypothèse sur la meilleure prochaine étape et sur la nécessité d'utiliser un outil.
  2. Action : l'agent sélectionne et appelle l'outil approprié.
  3. Observation : L'agent reçoit la sortie de l'outil. Ces nouvelles informations sont intégrées au contexte de l'agent et alimentent l'étape "Raisonnement" suivante du cycle.

Cas d'utilisation

Automatisation des RH à l'échelle de l'entreprise

Pour intégrer un nouvel employé, l'agent lance séquentiellement des actions dans plusieurs systèmes. Tout d'abord, il crée une fiche d'employé dans le système. Ensuite, il déclenche un appel d'API à l'agent informatique pour qu'il provisionne le matériel et les identifiants réseau. Enfin, il inscrit l'employé aux modules de formation obligatoires sur la conformité régionale.

Remédiation proactive de la chaîne d'approvisionnement

Pour détecter et résoudre automatiquement les perturbations de livraison, un agent est orchestré pour suivre des étapes clés. Tout d'abord, une alerte de surveillance déclenche un outil qui interroge d'autres fournisseurs. Il exécute ensuite un outil de simulation pour calculer le rapport coût-bénéfice du changement de fournisseur par rapport au retard de livraison. Enfin, si un humain valide la proposition, l'IA exécute l'action et envoie un nouveau bon de commande à l'agent logistique.

Exécution

Pour déployer un prototype d'agent fonctionnel dans un environnement de production à grande échelle, vous avez besoin d'une infrastructure d'exécution robuste intégrée à un système cohérent de services pour l'ancrage, les outils, la mémoire, les sessions et le reste. Vos agents peuvent ainsi travailler dans un écosystème sécurisé et performant, capable de répondre aux exigences complexes de la croissance des entreprises à l'échelle mondiale.

Un environnement d'exécution de niveau production nécessite :

Évolutivité  : l'infrastructure doit pouvoir s'adapter automatiquement pour gérer des charges variables, de zéro à des millions de requêtes. Cela inclut l'équilibrage de charge basé sur les requêtes et l'autoscaling basé sur les ressources pour gérer efficacement les besoins en calcul.

Sécurité et contrôle  : la plate-forme doit fournir un environnement d'exécution sécurisé, gérer l'identité des utilisateurs et des agents, les règles d'administration, les registres d'outils et d'agents, les contrôles d'accès au réseau et les canaux de communication sécurisés (comme TLS) pour protéger l'agent et les données auxquelles il accède.

Fiabilité et observabilité : le système doit inclure des mécanismes de gestion des erreurs et de surveillance continue. Pour un débogage complexe, l'environnement d'exécution doit capturer des traces d'exécution haute fidélité, c'est-à-dire un enregistrement pas à pas du raisonnement de l'agent et des appels d'outils. Cela expose toute la trajectoire d'une décision, ce qui permet à vos équipes de répondre définitivement à la question "Pourquoi ?" en cas d'échec inattendu. Pour une supervision de haut niveau, le système doit inclure des métriques pour l'exécution des tâches et les commentaires des utilisateurs. L'automatisation avec des simulations et des évaluations permet de gagner en confiance avant et après le déploiement en production.

Découvrez comment créer, faire évoluer et gérer des agents IA.

Notre guide sur les systèmes multi-agents pour les entreprises vous montre comment créer des solutions basées sur l'IA efficaces, évolutives et sécurisées sans sacrifier la robustesse de l'entreprise.

Google Cloud