Modèle de ressource

Le schéma suivant présente le modèle de ressource Cloud Run :

Services et révisions Cloud Run

Le schéma montre un projet Google Cloud contenant deux services Cloud Run, Service A et Service B, chacun ayant plusieurs révisions.

Nous voyons que le Service A reçoit de nombreuses requêtes, ce qui entraîne le démarrage et l'exécution de plusieurs instances de conteneur. Notez que le Service B ne reçoit pas de requêtes pour l'instant, donc aucune instance de conteneur n'est encore démarrée.

Services Cloud Run

Le service est la ressource principale de Cloud Run. Chaque service est situé dans une région GCP spécifique (Cloud Run) ou dans un espace de noms de cluster GKE (Cloud Run pour Anthos sur Google Cloud). Pour la redondance et le basculement, les services sont automatiquement répliqués dans plusieurs zones de la région dans laquelle ils se trouvent. Un projet GCP donné peut exécuter de nombreux services dans des régions ou clusters GKE différents.

Chaque service expose un point de terminaison unique et adapte automatiquement l'infrastructure sous-jacente pour gérer les requêtes entrantes.

Révisions de Cloud Run

Chaque déploiement sur un service crée une révision. Une révision comprend une image de conteneur spécifique, ainsi que des paramètres d'environnement tels que des variables d'environnement, des limites de mémoire ou une valeur de simultanéité.

Les révisions sont immuables : une fois une révision créée, elle ne peut plus être modifiée. Par exemple, lorsque vous déployez une image de conteneur dans un nouveau service Cloud Run, la première révision est créée. Si vous déployez ensuite une image de conteneur différente sur ce même service, une deuxième révision est créée. Si vous définissez ensuite une variable d'environnement, une troisième révision est créée, et ainsi de suite.

Les requêtes sont automatiquement acheminées dès que possible vers la dernière révision de service opérationnelle.

Instances de conteneur Cloud Run

Chaque révision recevant des requêtes est automatiquement adaptée au nombre d'instances de conteneur nécessaires pour les traiter en totalité. Notez qu'une instance de conteneur peut recevoir plusieurs requêtes en même temps. Le paramètre de simultanéité vous permet de définir le nombre maximal de requêtes pouvant être envoyées en parallèle à une instance de conteneur donnée.