Exécutez des services d'interface et de backend, des jobs par lot, des LLM hôtes et des charges de travail de traitement de file d'attente sans avoir à gérer l'infrastructure.
Obtenez 2 millions de requêtes gratuites par mois
La flexibilité des conteneurs et la simplicité de l'informatique sans serveur
Commencez avec le code source et exécutez votre application dans plus de 20 régions à la fois
Ne payez que lorsque votre code est en cours d'exécution.
Déployez et créez des applications et des sites Web
Fonctionnalités
Vous pouvez écrire du code en utilisant le langage, le framework et les bibliothèques de votre choix, l'empaqueter en tant que conteneur, puis exécuter "gcloud run deploy". Votre application sera alors disponible, et fournie avec tout ce dont elle a besoin pour s'exécuter en production.La création d'un conteneur est totalement facultative. Si vous utilisez Go, Node.js, Python, Java, .NET Core ou Ruby, vous pouvez choisir l'option de déploiement basé sur la source qui crée le conteneur en suivant les bonnes pratiques du langage que vous utilisez.
Que vous possédiez des services de longue durée basés sur des événements ou que vous déployiez des jobs conteneurisés pour traiter des données, Cloud Run effectue un scaling automatique de vos conteneurs à la hausse ou à la baisse à partir de zéro. Ainsi, vous ne payez que lorsque votre code est en cours d'exécution.
(Désormais en version Preview publique) Permet un accès à la demande aux GPU NVIDIA L4 pour exécuter des charges de travail d'inférence IA. Il permet de bénéficier de taux de jetons rapides pour les modèles comportant jusqu'à neuf milliards de paramètres.
(Désormais en version Preview publique) Écrivez et déployez des fonctions directement avec Cloud Run afin de bénéficier d'un contrôle total sur la configuration de service sous-jacente.
Cloud Run peut également automatiser le processus de mise en production en utilisant des buildpacks pour vous permettre d'effectuer des déploiements directement depuis la source, sans avoir à installer Docker sur votre machine. Vous pouvez automatiser vos compilations et déployer votre code chaque fois que de nouveaux commits sont envoyés vers une branche donnée d'un dépôt Git.
Les jobs Cloud Run vous permettent d'effectuer un traitement par lot avec des instances exécutées en parallèle. Ils peuvent exécuter des jobs du début à la fin qui ne répondent pas aux requêtes HTTP, le tout sur une plate-forme sans serveur. Exécutez vos jobs pendant 24 heures maximum.
Envoyez directement le trafic vers un réseau VPC et connectez-vous à tous les services exécutés sur le VPC.
Fonctionnement
Cloud Run est une plate-forme entièrement gérée qui vous permet d'exécuter votre code directement sur l'infrastructure évolutive de Google. Cloud Run est une solution simple, automatisée et conçue pour améliorer votre productivité.
Utilisations courantes
Déployer et héberger un site Web avec Cloud Run
Créez votre application Web à l'aide de votre pile préférée, accédez à votre base de données SQL et affichez des pages HTML dynamiques. Cloud Run vous permet également d'effectuer un scaling à zéro instance lorsqu'aucune requête n'arrive sur votre site Web.
Dans cet atelier de programmation, vous commencerez avec une image Docker créée via Cloud Build, que vous déclencherez dans Cloud Shell. Vous allez ensuite déployer cette image dans Cloud Run à l'aide d'une commande dans Cloud Shell.
Déployer et héberger un site Web avec Cloud Run
Créez votre application Web à l'aide de votre pile préférée, accédez à votre base de données SQL et affichez des pages HTML dynamiques. Cloud Run vous permet également d'effectuer un scaling à zéro instance lorsqu'aucune requête n'arrive sur votre site Web.
Dans cet atelier de programmation, vous commencerez avec une image Docker créée via Cloud Build, que vous déclencherez dans Cloud Shell. Vous allez ensuite déployer cette image dans Cloud Run à l'aide d'une commande dans Cloud Shell.
Héberger des LLM avec des GPU Cloud Run
Effectuez des inférences par IA en temps réel à l'aide des LLM de votre choix sur Cloud Run, y compris Llama 3.1, Mistral et Gemma 2. Cette solution est également idéale pour les applications qui utilisent beaucoup de ressources de calcul, comme la reconnaissance d'images, le transcodage vidéo et le streaming.
Héberger des LLM avec des GPU Cloud Run
Effectuez des inférences par IA en temps réel à l'aide des LLM de votre choix sur Cloud Run, y compris Llama 3.1, Mistral et Gemma 2. Cette solution est également idéale pour les applications qui utilisent beaucoup de ressources de calcul, comme la reconnaissance d'images, le transcodage vidéo et le streaming.
Vous pouvez créer une API REST, une API GraphQL ou des microservices privés qui communiquent via HTTP ou gRPC.
Vous pouvez créer une API REST, une API GraphQL ou des microservices privés qui communiquent via HTTP ou gRPC.
Les services Cloud Run peuvent recevoir des messages provenant d'abonnements push Pub/Sub et d'événements Eventarc.
Les services Cloud Run peuvent recevoir des messages provenant d'abonnements push Pub/Sub et d'événements Eventarc.
Exécutez des scripts, des jobs Cron ou des charges de travail de traitement de données chargées en parallèle. Idéal pour les jobs de longue durée ou pour lesquels le temps de réalisation est important.
Exécutez des scripts, des jobs Cron ou des charges de travail de traitement de données chargées en parallèle. Idéal pour les jobs de longue durée ou pour lesquels le temps de réalisation est important.
Tarification
Fonctionnement des tarifs de Cloud Run | Tarification à l'utilisation, avec un niveau Toujours gratuit, le total étant arrondi à la centaine de millisecondes la plus proche. Si vous ne l'utilisez pas, vous ne payez rien. | |
---|---|---|
Code SKU | Tarif au-delà de la version gratuite sans remise | Gratuit |
Processeur | 0,00001800 $ par vCPU-seconde | 240 000 premières unités de processeur virtuel-seconde gratuites par mois |
Mémoire | 0,00000200 $ par Gio-seconde | 450 000 premiers Gio-seconde gratuits par mois |
Réduisez l'utilisation continue de Cloud Run en souscrivant des remises sur engagement d'utilisation.
Fonctionnement des tarifs de Cloud Run
Tarification à l'utilisation, avec un niveau Toujours gratuit, le total étant arrondi à la centaine de millisecondes la plus proche. Si vous ne l'utilisez pas, vous ne payez rien.
Processeur
0,00001800 $ par vCPU-seconde
240 000 premières unités de processeur virtuel-seconde gratuites par mois
0,00000200 $ par Gio-seconde
450 000 premiers Gio-seconde gratuits par mois
Réduisez l'utilisation continue de Cloud Run en souscrivant des remises sur engagement d'utilisation.
Cas d'utilisation métier
Découvrez comment d'autres entreprises réduisent leurs coûts, augmentent leur ROI et favorisent l'innovation avec Cloud Run
BBC : s'adapter aux journées d'actualités chargées grâce à une architecture sans serveur de bout en bout
La BBC est passée de 150 à 200 instances de conteneur exécutées à plus de 1 000 lors d'un pic de trafic massif. "Et l'infrastructure a très bien fonctionné."
Lire le témoignageClients à la une
Partenaires et intégration
Questions fréquentes
Grâce à Cloud Run, vous pouvez gérer et déployer votre site Web sans les frais généraux liés aux déploiements sur des VM ou sur Kubernetes. Il s'agit non seulement d'une approche plus simple du point de vue de la gestion, mais cela vous permet également d'effectuer un scaling à zéro instance lorsqu'aucune demande n'arrive sur votre site Web.
Cloud Run est conçu pour améliorer l'expérience App Engine, en intégrant bon nombre des meilleures fonctionnalités de l'environnement standard et de l'environnement flexible App Engine. Les services Cloud Run peuvent gérer les mêmes charges de travail que les services App Engine, y compris le déploiement et l'hébergement de sites Web. Toutefois, Cloud Run offre aux clients beaucoup plus de flexibilité dans la mise en œuvre de ces services.