Modello di risorsa

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Il seguente diagramma mostra il modello di risorse Cloud Run per i servizi:

Servizi e revisioni Cloud Run

Il diagramma mostra un progetto Google Cloud contenente due servizi Cloud Run, Service A e Service B, ognuno dei quali ha diverse revisioni.

Nel diagramma, Service A sta ricevendo molte richieste, il che comporta l'avvio e l'esecuzione di diverse istanze di container. Tieni presente che al momento Service B non riceve richieste, quindi non è ancora stata avviata alcuna istanza di container.

Servizi Cloud Run

Il servizio è la risorsa principale di Cloud Run. Ogni servizio si trova in un'area geografica GCP specifica (Cloud Run). Per ridondanza e failover, i servizi vengono replicati automaticamente su più zone nell'area geografica in cui si trovano. Un determinato progetto GCP può eseguire molti servizi in aree geografiche diverse.

Ogni servizio espone un endpoint univoco e scala automaticamente l'infrastruttura sottostante per gestire le richieste in entrata.

Revisioni Cloud Run

Ogni deployment in un servizio crea una revisione. Una revisione è composta da una specifica immagine container e da impostazioni di ambiente come variabili di ambiente, limiti di memoria o valore di contemporaneità.

Le revisioni sono immutabili: una volta creata, una revisione non può essere modificata. Ad esempio, quando esegui il deployment di un'immagine container su un nuovo servizio Cloud Run, viene creata la prima revisione. Se successivamente esegui il deployment di un'immagine container diversa sullo stesso servizio, viene creata una seconda revisione. Se successivamente imposti una variabile di ambiente, viene creata una terza revisione e così via.

Le richieste vengono instradate automaticamente il prima possibile all'ultima revisione del servizio in stato integro.

Job Cloud Run

Ogni job si trova in un'area geografica specifica di Google Cloud ed esegue uno o più container. Un job è costituito da una o più attività indipendenti eseguite in parallelo in una determinata esecuzione. Ogni attività esegue un'istanza di container e potrebbe riprovare.

Esecuzioni di job Cloud Run

Quando viene eseguito un job, viene creata un'esecuzione in cui vengono avviate tutte le attività dei job. Tutte le attività in un'esecuzione del job devono essere completate correttamente per eseguire correttamente il job. Puoi impostare timeout per le attività e specificare il numero di nuovi tentativi in caso di errore. Se un'attività supera il numero massimo di nuovi tentativi, viene contrassegnata come non riuscita e il job viene contrassegnato come non riuscito. Per impostazione predefinita, le attività vengono eseguite in parallelo fino a un massimo di 100, ma puoi specificare un valore massimo inferiore se una delle risorse di supporto lo richiede.

Istanze container Cloud Run

Ogni richiesta che riceve le richieste viene scalata automaticamente in base al numero di istanze di container necessarie per gestire tutte queste richieste. Tieni presente che un'istanza di container può ricevere molte richieste contemporaneamente. Con l'impostazione di contemporaneità, puoi impostare il numero massimo di richieste che possono essere inviate in parallelo a una determinata istanza di container.