Hébergez des agents d'IA à l'aide de Cloud Run. Les agents d'IA peuvent être implémentés en tant que services Cloud Run, et effectuer des tâches et fournir des informations aux utilisateurs de manière conversationnelle. Cloud Run offre un scaling automatique et une haute évolutivité sans provisionnement de ressources, et ne facture que l'utilisation réelle. Les agents d'IA peuvent être utilisés à des fins diverses, comme le service client, les assistants virtuels et la génération de contenu.
Vous pouvez utiliser un service Cloud Run comme point de terminaison d'API évolutif pour traiter les requêtes des utilisateurs finaux. Votre service exécute un framework d'orchestration d'IA, tel que LangChain, LangGraph ou Firebase Genkit, qui orchestre les appels aux éléments suivants:
- Modèles d'IA tels que l'API Gemini, les points de terminaison Vertex AI ou un autre service Cloud Run compatible avec les GPU.
- Bases de données vectorielles telles que Cloud SQL pour PostgreSQL ou AlloyDB pour PostgreSQL avec l'extension
pgvector
. - Autres services ou API
Pour une architecture plus détaillée, consultez Infrastructure pour une application d'IA générative compatible avec RAG à l'aide de Vertex AI et d'AlloyDB pour PostgreSQL.
Découvrez comment déployer Firebase Genkit sur Cloud Run dans la documentation Firebase Genkit.
Découvrez comment créer et déployer une application LangChain sur Cloud Run en suivant un codelab.