Vertex AI Agent Engine (anciennement appelé LangChain sur Vertex AI ou Vertex AI Reasoning Engine) est un service Google Cloud entièrement géré qui permet aux développeurs de déployer, de gérer et d'étendre des agents d'IA en production. Agent Engine gère l'infrastructure pour faire évoluer les agents en production afin que vous puissiez vous concentrer sur la création d'applications intelligentes et efficaces. Vertex AI Agent Engine propose:
Entièrement géré: déployez et faites évoluer des agents avec un environnement d'exécution géré qui offre des fonctionnalités de sécurité robustes, y compris la conformité avec VPC-SC et des fonctionnalités de gestion complètes de bout en bout. Obtenez un accès CRUD aux applications multi-agents qui utilisent Google Cloud Trace (compatible avec OpenTelemetry) pour la surveillance et le suivi des performances. Pour en savoir plus, consultez la section Déployer un agent.
Qualité et évaluation: assurez la qualité des agents avec le service d'évaluation rapide Vertex AI intégré.
Développement simplifié: Agent Engine élimine les tâches de bas niveau telles que le développement du serveur d'application et la configuration de l'authentification et d'IAM, ce qui vous permet de vous concentrer sur les fonctionnalités uniques de votre agent, telles que son comportement, ses outils et ses paramètres de modèle. De plus, vos agents peuvent utiliser n'importe quel modèle et outil, comme l'appel de fonction, dans Vertex AI.
Indépendant du framework: bénéficiez de la flexibilité lors du déploiement des agents que vous créez à l'aide de différents frameworks Python, y compris LangGraph, Langchain, AG2 et CrewAI. Si vous disposez déjà d'un agent, vous pouvez l'adapter pour qu'il s'exécute sur Agent Engine à l'aide du modèle personnalisé de notre SDK. Sinon, vous pouvez développer un agent à partir de zéro à l'aide de l'un des modèles spécifiques au framework que nous fournissons.
Cas d'utilisation
Pour en savoir plus sur Agent Engine avec des exemples de bout en bout, consultez les ressources suivantes:
Cas d'utilisation | Description | Lien(s) |
---|---|---|
Créer des agents en se connectant à des API publiques | Convertir des devises Créez une fonction qui se connecte à une application de change de devises pour permettre au modèle de fournir des réponses précises à des requêtes telles que "Quel est le taux de change de l'euro par rapport au dollar aujourd'hui ?" |
Notebook du SDK Vertex AI pour Python : présentation de la création et du déploiement d'un agent avec Agent Engine |
Concevoir un projet d'énergie solaire communautaire. Identifiez les emplacements potentiels, recherchez les autorités administratives et les fournisseurs concernés, et examinez les images satellites et le potentiel solaire des régions et des bâtiments pour trouver l'emplacement optimal pour installer vos panneaux solaires. |
Notebook du SDK Vertex AI pour Python : créer et déployer un agent de l'API Google Maps avec Vertex AI Agent Engine | |
Créer des agents en se connectant à des bases de données | Intégration avec AlloyDB et CloudSQL PostgreSQL. | Article de blog : Annonce de LangChain sur Vertex AI pour AlloyDB et Cloud SQL pour PostgreSQL Notebook du SDK Vertex AI pour Python : déployer une application RAG avec Cloud SQL pour PostgreSQL sur LangChain dans Vertex AI Notebook du SDK Vertex AI pour Python : déployer une application RAG avec AlloyDB sur LangChain dans Vertex AI |
Interroger et comprendre des datastores structurés en langage naturel | Notebook SDK Vertex AI pour Python : créer un agent de recherche conversationnel avec Vertex AI Agent Engine et le RAG dans Vertex AI Search | |
Interroger et comprendre des bases de données orientées graphe en langage naturel | Article de blog : GraphRAG GenAI et agents d'IA utilisant Vertex AI Agent Engine avec LangChain et Neo4j | |
Interroger et comprendre des magasins de vecteurs en langage naturel | Article de blog : Simplifier le RAG GenAI avec MongoDB Atlas et Vertex AI Agent Engine | |
Créer des agents avec des frameworks OSS | Créez et déployez des agents à l'aide du framework Open Source Onetwo. | Article de blog : OneTwo et Vertex AI Agent Engine : explorer le développement d'agents d'IA avancée sur Google Cloud |
Créer et déployer des agents à l'aide du framework Open Source LangGraph. | Notebook SDK Vertex AI pour Python : créer et déployer une application LangGraph avec Vertex AI Agent Engine | |
Déboguer et optimiser les agents | Créer et tracer des agents à l'aide d'OpenTelemetry et de Cloud Trace | Notebook SDK Vertex AI pour Python : débogage et optimisation des agents : guide de traçage dans Vertex AI Agent Engine |
Créer et déployer sur Agent Engine
Remarque:Pour une expérience de développement et de déploiement simplifiée, basée sur un IDE avec Agent Engine, envisagez le agent-starter-pack. Il fournit des modèles prêts à l'emploi, une UI intégrée pour l'expérimentation, et simplifie le déploiement, les opérations, l'évaluation, la personnalisation et l'observabilité.
Le workflow de création d'un agent sur Agent Engine est le suivant:
Étapes | Description |
---|---|
1. Configurer l'environnement | Configurez votre projet Google et installez la dernière version du SDK Vertex AI pour Python. |
2. Développer un agent | Développez un agent pouvant être déployé sur Agent Engine. |
3. Déployer l'agent | Déployez l'agent sur l'environnement d'exécution géré Agent Engine. |
4. Utiliser l'agent | Interrogez l'agent en envoyant une requête API. |
5. Gérer l'agent déployé | Gérez et supprimez les agents que vous avez déployés sur Agent Engine. |
Les étapes sont illustrées dans le schéma suivant :
Sécurité d'entreprise
Agent Engine est compatible avec VPC Service Controls pour renforcer la sécurité des données et limiter les risques d'exfiltration des données. Lorsque VPC Service Controls est configuré, l'agent déployé conserve un accès sécurisé aux API et services Google, tels que l'API BigQuery, l'API Cloud SQL Admin et l'API Vertex AI, ce qui garantit un fonctionnement fluide dans le périmètre que vous avez défini. Plus important encore, VPC Service Controls bloque efficacement tout accès à l'Internet public, limitant le transfert de données aux limites de votre réseau autorisé et améliorant considérablement votre posture de sécurité d'entreprise.
Tarifs
Les tarifs sont basés sur les ressources de calcul (heures de vCPU) et de mémoire (heures de GiB) utilisées par les agents déployés dans l'environnement d'exécution géré par Agent Engine.
Produit | ID du SKU | Prix |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | 0,0994 $/vCPU-h |
Mémoire ReasoningEngine | 0B45-6103-6EC1 | 0,0105 $/GiGo/h |
Pour en savoir plus, reportez-vous à la page Tarifs.