Configura il numero massimo di istanze

Puoi controllare il comportamento di scalabilità della funzione impostando un valore massimo di istanze di funzioni Cloud Run. L'impostazione del numero massimo di istanze consente di controllare i costi e impedisce alle risorse a valle di essere sopraffatte dal traffico.

Le funzioni Cloud Run si scalano creando nuove istanze della funzione. Ogni di queste istanze può gestire una sola richiesta alla volta, pertanto picchi elevati nel volume delle richieste potrebbero comportare la creazione di molte istanze.

La scalabilità automatica è vantaggiosa nella maggior parte dei casi, ma in alcuni casi potresti volere limitare il numero totale di istanze che possono esistere in un determinato momento. Ad esempio, la tua funzione potrebbe interagire con un database che può gestire solo un certo numero di connessioni aperte.

Le funzioni Cloud Run offrono la concorrenza come meccanismo di scalabilità aggiuntivo. Una funzione configurata per la contemporaneità può eseguire più richieste contemporaneamente su una singola istanza. Puoi configurare una funzione in modo che utilizzi entrambi e di più istanze per ottimizzarne le prestazioni. Per saperne di più configurazione della contemporaneità, consulta Contemporaneità delle funzioni Cloud Run.

Impostazione dei limiti di istanze massime

Puoi impostare un numero massimo di istanze per una funzione durante il deployment. Ciascuna ha la propria impostazione del numero massimo di istanze. Le funzioni scalano in modo indipendente l'una dall'altra. Le funzioni Cloud Run richiedono un limite massimo di istanze definito.

Impostazione dei limiti di istanze massime

Puoi impostare un limite massimo di istanze utilizzando Google Cloud CLI o la console Google Cloud. Se non specifichi un limite, le funzioni Cloud Run impostano un valore predefinito di 100.

Per impostare un limite massimo di istanze:

Console

  1. Vai alla pagina Panoramica delle funzioni Cloud Run.

  2. Fai clic su Crea funzione.

  3. Compila i campi obbligatori per la funzione.

  4. Espandi la sezione Runtime, build... alla fine della pagina e fai clic su la scheda Runtime.

  5. Nel campo Numero massimo di istanze della sezione Scalabilità automatica, inserisci un valore o utilizza quello predefinito.

gcloud

Per impostare un limite massimo di istanze, esegui il comando deploy con Flag --max-instances:

gcloud functions deploy FUNCTION_NAME --max-instances MAX_INSTANCE_LIMIT

Sostituisci quanto segue:

  • FUNCTION_NAME: il nome della funzione.

  • MAX_INSTANCE_LIMIT: il numero da impostare come limite massimo di istanze, ad esempio 3000.

Limiti e best practice

Questa sezione fornisce le linee guida per l'utilizzo del numero massimo di istanze.

Scegli un valore massimo per l'istanza

Il valore ottimale per l'impostazione del numero massimo di istanze dipende dal parametro della funzione caratteristiche, tra cui il tempo necessario per l'esecuzione di una chiamata, le sue previsioni frequenza di chiamata media e massima, nonché la tolleranza della tua applicazione errori di chiamata. Una buona regola pratica è iniziare con un numero massimo di istanze pari a 3, quindi monitora gli errori di chiamata e regola il numero massimo o aumentare il valore delle istanze.

Gestione delle richieste quando tutte le istanze sono occupate

In circostanze normali, la funzione esegue il ridimensionamento in alto creando nuove istanze per gestire il carico del traffico in entrata. Ma se imposti un limite massimo di istanze, potresti riscontrare uno scenario in cui non ci sono istanze sufficienti da soddisfare carico di traffico in entrata.

In questo scenario, Cloud Run Functions tenta di gestire una nuova richiesta in entrata per Fino a 30 secondi:

  • Se un'istanza termina l'elaborazione della richiesta durante questo periodo di tempo, potrebbe iniziare a elaborare la nuova richiesta in entrata.
  • Se non viene creata alcuna istanza, la richiesta non andrà a buon fine.

Le richieste inviate a funzioni HTTP sovraccarcate non vanno a buon fine con un codice di risposta 429 Too Many Requests.

Gli eventi destinati alle funzioni basate su eventi verranno salvati automaticamente fino a quando non sarà disponibile la capacità.

Limiti massimi di istanze che superano la capacità di scalabilità delle funzioni di Cloud Run

Quando specifichi un limite massimo di istanze, indichi un limite superiore. L'impostazione di un limite elevato non implica lo scale up della funzione di istanze VM specificato. Significa solo che il numero di istanze che coesistono in un determinato momento non deve superare il limite.

Inoltre, l'impostazione di un limite massimo di istanze potrebbe influire sulle strategie di scalabilità usate dalle funzioni di Cloud Run per soddisfare la domanda di traffico. In generale, Le funzioni Cloud Run daranno la priorità al rispetto del limite specificato anziché fare lo scale up e superare potenzialmente il limite.

Gestione dei picchi di traffico

In alcuni casi, come i rapidi picchi di traffico, le funzioni Cloud Run potrebbero, per una breve di un periodo di tempo, crea un numero maggiore di istanze rispetto al numero massimo specificato limite. Se la funzione non può tollerare questo comportamento temporaneo, ti consigliamo di prendere in considerazione un margine di sicurezza e di impostare un valore di istanze massime inferiore a quello tollerato dalla funzione.

Deployment

Quando esegui il deployment di una nuova versione della funzione, le funzioni Cloud Run eseguono la migrazione del traffico dalla versione precedente alla nuova. Poiché i limiti di istanze massime sono impostati in modo indipendente per ogni versione della funzione, potresti superare temporaneamente il limite specificato nel periodo successivo al deployment.

Ad esempio, una funzione potrebbe avere un limite massimo di istanze pari a 5. In circostanze normali, la funzione esegue lo scale up fino a 5 istanze man mano che gestisce le richieste. Quando viene eseguita il deployment di una nuova versione della funzione, questa ha un proprio limite di 5 istanze massime.

Le richieste già gestite dalla versione precedente della funzione non vengono interrotte quando viene implementata una nuova versione della funzione. Al contrario, queste richieste continueranno a essere elaborate. Le nuove richieste in entrata verranno gestite dalla versione appena implementata della funzione.

Pertanto, la funzione nell'esempio precedente potrebbe avere fino a 10 istanze totali (5 per ogni versione della funzione) durante il periodo successivo al deployment della nuova versione. Il tempo necessario per l'interruzione delle istanze della funzione precedente dipende dal tempo necessario per completare la gestione di eventuali richieste attive. Questo è un altro fattore da tenere in considerazione quando selezionando un limite massimo di istanze appropriato.