Modèle de ressource

Le schéma suivant illustre le modèle de ressource Cloud Run pour les services :

Services et révisions Cloud Run

Le schéma montre un projet Google Cloud contenant trois services Cloud Run, Service A, Service B et Service C, chacun ayant plusieurs révisions.

Le diagramme montre que le Service A reçoit de nombreuses requêtes, ce qui entraîne le démarrage et l'exécution de plusieurs instances, chacune exécutant un seul conteneur. Notez que le Service B ne reçoit pas de requêtes pour l'instant, donc aucune instance n'est encore démarrée. Le Service C exécute plusieurs conteneurs par instance dans chaque révision : notez que seul le conteneur d'entrée reçoit la requête. Chaque instance comportant plusieurs conteneurs évolue en tant qu'unité indépendante.

Services Cloud Run

Le service est la ressource principale de Cloud Run. Chaque service est situé dans une région Google Cloud spécifique (Cloud Run). Pour la redondance et le basculement, les services sont automatiquement répliqués dans plusieurs zones de la région dans laquelle ils se trouvent. Un projet Google Cloud donné peut exécuter de nombreux services dans différentes régions.

Chaque service expose un point de terminaison unique et adapte automatiquement l'infrastructure sous-jacente pour gérer les requêtes entrantes.

Révisions de Cloud Run

Chaque déploiement sur un service crée une révision. Une révision comprend une ou plusieurs images de conteneurs, ainsi que des paramètres d'environnement tels que des variables d'environnement, des limites de mémoire ou une valeur de simultanéité.

Les révisions sont immuables : une fois une révision créée, elle ne peut plus être modifiée. Par exemple, lorsque vous déployez une image de conteneur dans un nouveau service Cloud Run, la première révision est créée. Si vous déployez ensuite une image de conteneur différente sur ce même service, une deuxième révision est créée. Si vous définissez ensuite une variable d'environnement, une troisième révision est créée, et ainsi de suite.

Les requêtes sont automatiquement acheminées dès que possible vers la dernière révision de service opérationnelle.

Tâches Cloud Run

Chaque tâche est située dans une région Google Cloud spécifique et exécute un ou plusieurs conteneurs jusqu'à la fin. Une tâche comprend une ou plusieurs tâches indépendantes exécutées en parallèle dans une exécution de tâche donnée. Chaque tâche exécute une instance et peut effectuer de nouvelles tentatives.

Exécutions de tâches Cloud Run

Lorsqu'un job est exécuté, une exécution de job est créée, dans laquelle toutes les tâches du job sont démarrées. Toutes les tâches d'une exécution de job doivent réussir pour que l'exécution du job aboutisse. Vous pouvez définir des délais avant expiration sur des tâches et spécifier le nombre de tentatives en cas d'échec de la tâche. Si une tâche dépasse son nombre maximal de tentatives, elle est marquée comme failed (échec) et le job est marqué comme failed (échec). Par défaut, les tâches s'exécutent en parallèle jusqu'à un maximum de 100, mais vous pouvez spécifier un maximum inférieur si l'une de vos ressources de sauvegarde l'exige.

Instances Cloud Run

Chaque révision recevant des requêtes est automatiquement adaptée au nombre d'instances nécessaires pour les traiter en totalité. Notez que le conteneur d'entrée au sein d'une instance peut recevoir plusieurs requêtes en même temps. Le paramètre de simultanéité vous permet de définir le nombre maximal de requêtes pouvant être envoyées en parallèle à une instance donnée.