Il seguente diagramma mostra il modello di risorse Cloud Run for Anthos:
Il diagramma mostra un progetto Google Cloud contenente due servizi Cloud Run for Anthos, Service A
e Service B
, ognuno dei quali ha diverse revisioni.
Nel diagramma, Service A
sta ricevendo molte richieste, il che comporta l'avvio e l'esecuzione di diverse istanze di container. Tieni presente che al momento Service B
non riceve richieste, quindi non è ancora stata avviata alcuna istanza di container.
Servizi Cloud Run for Anthos
Il servizio è la risorsa principale di Cloud Run for Anthos. Ogni servizio si trova in uno specifico spazio dei nomi del cluster GKE.
Un determinato progetto Google Cloud può eseguire molti servizi in aree geografiche diverse o cluster GKE.
Ogni servizio espone un endpoint univoco e scala automaticamente l'infrastruttura sottostante per gestire le richieste in entrata.
Revisioni di Cloud Run for Anthos
Ogni deployment in un servizio crea una revisione. Una revisione è composta da una specifica immagine container e da impostazioni di ambiente come variabili di ambiente, limiti di memoria o valore di contemporaneità.
Le revisioni sono immutabili: una volta creata, una revisione non può essere modificata. Ad esempio, quando esegui il deployment di un'immagine container in un nuovo servizio Cloud Run for Anthos, viene creata la prima revisione. Se successivamente esegui il deployment di un'immagine container diversa sullo stesso servizio, viene creata una seconda revisione. Se successivamente imposti una variabile di ambiente, viene creata una terza revisione e così via.
Le richieste vengono instradate automaticamente il prima possibile all'ultima revisione del servizio in stato integro. Puoi suddividere il traffico tra le diverse revisioni come preferisci.
Istanze container Cloud Run for Anthos
Ogni richiesta che riceve le richieste viene scalata automaticamente in base al numero di istanze di container necessarie per gestire tutte queste richieste. Tieni presente che un'istanza di container può ricevere molte richieste contemporaneamente. Con l'impostazione di contemporaneità, puoi impostare il numero massimo di richieste che possono essere inviate in parallelo a una determinata istanza di container.