Informazioni sulle decisioni del gestore della scalabilità automatica

La scalabilità automatica aggiunge automaticamente le VM (con lo scale out) o rimuove le VM (con lo scale in) al tuo gruppo di istanze gestite. Questo documento illustra in che modo un gestore della scalabilità automatica determina quando scalare i gruppi di istanze gestite.

Quando configuri un gestore della scalabilità automatica per un gruppo di istanze gestite, il gestore della scalabilità automatica monitora costantemente il gruppo e imposta la dimensione consigliata del gruppo sul numero di istanze di macchine virtuali (VM) necessarie per gestire i picchi di carico nel periodo di stabilizzazione.

La dimensione consigliata è vincolata dal numero minimo e massimo di istanze impostate nel criterio di scalabilità automatica.

Se il criterio di scalabilità automatica include controlli di scale in, la dimensione consigliata è ulteriormente vincolata dai controlli di scale in.

Se abiliti la scalabilità automatica predittiva, il gestore della scalabilità automatica utilizza i pattern di utilizzo storici della CPU per prevedere il carico futuro e imposta le dimensioni consigliate per il gruppo in base alla previsione.

La risposta del gruppo di istanze gestite alle dimensioni consigliate del gestore della scalabilità automatica dipende da come configuri mode del gestore della scalabilità automatica:

  • ON. Il gruppo di istanze gestite imposta le dimensioni di destinazione sulle dimensioni consigliate, quindi Compute Engine fa automaticamente lo scale out del gruppo di istanze gestite in base alle dimensioni target.
  • ONLY_SCALE_OUT. La dimensione target del gruppo di istanze gestite può essere aumentata solo in risposta a un aumento delle dimensioni consigliate.
  • OFF. La dimensione target non è influenzata dalla dimensione consigliata. Tuttavia, la dimensione consigliata viene comunque calcolata.

Se la configurazione del gestore della scalabilità automatica viene eliminata, non vengono calcolate dimensioni consigliate.

Differenze tra le metriche di utilizzo target ed effettivo

Quando utilizzi un criterio di scalabilità automatica con indicatori basati sulle metriche, potresti notare che, per gruppi di istanze più piccoli, l'utilizzo effettivo del gruppo di istanze e l'utilizzo di destinazione potrebbero sembrare distanti. Questo perché un gestore della scalabilità automatica agisce sempre in modo prudente arrotondando per eccesso o per difetto quando interpreta i dati sull'utilizzo e determina il numero di istanze da aggiungere o rimuovere. Ciò impedisce al gestore della scalabilità automatica di aggiungere un numero insufficiente di risorse o di rimuovere troppe risorse.

Ad esempio, se imposti un target di utilizzo di 0,7 e la tua applicazione supera il target di utilizzo, il gestore della scalabilità automatica potrebbe determinare che l'aggiunta di 1,5 istanze di macchina virtuale (VM) ridurrebbe l'utilizzo fino a raggiungere quasi 0,7. Poiché non puoi aggiungere 1,5 istanze VM, il gestore della scalabilità automatica arrotonda e aggiunge due istanze. Ciò potrebbe ridurre l'utilizzo medio della CPU fino a un valore inferiore a 0,7, ma garantisce che la tua app abbia risorse sufficienti per supportarlo.

Allo stesso modo, se il gestore della scalabilità automatica stabilisce che la rimozione di 1,5 istanze VM comporta un aumento dell'utilizzo troppo vicino a 0,7, rimuoverà solo un'istanza.

Per gruppi più grandi con più istanze VM, l'utilizzo viene suddiviso su un numero maggiore di istanze e l'aggiunta o la rimozione di istanze VM causa un divario minore tra l'utilizzo effettivo e l'utilizzo target.

Se utilizzi la scalabilità automatica basata su pianificazione con un altro indicatore di scalabilità automatica, una pianificazione attiva potrebbe richiedere più VM rispetto alle esigenze del tuo utilizzo. In queste situazioni, l'utilizzo effettivo è inferiore all'utilizzo target perché la pianificazione della scalabilità automatica determina la dimensione consigliata del gruppo di istanze.

Gruppi di istanze gestite a livello di regione e distribuzioni delle VM irregolari

Se una regione ha un numero non bilanciato di istanze tra le zone, a causa del ripristino da un errore a livello di zona o a causa di un carico di lavoro distribuito non uniforme, la scalabilità automatica mantiene più istanze in esecuzione in zone con un utilizzo effettivo superiore alla media. Compute Engine prende questa precauzione per garantire l'alta disponibilità nell'intera regione e in tutte le singole zone, anche se alcune presentano un carico più elevato di altre.

Ritardi nello scale out

Quando configuri la scalabilità automatica, specifichi un periodo di inizializzazione che riflette il tempo necessario per l'inizializzazione delle VM. Il gestore della scalabilità automatica consiglia di fare lo scale out solo se l'utilizzo medio delle istanze che non vengono inizializzate è maggiore dell'utilizzo target.

Se imposti un valore del periodo di inizializzazione molto più lungo del tempo necessario per l'inizializzazione di un'istanza, il gestore della scalabilità automatica potrebbe ignorare i dati sull'utilizzo legittimi e potrebbe sottostimare le dimensioni richieste del gruppo.

Ritardi nello scale in

Ai fini dell'applicazione dello scale in, il gestore della scalabilità automatica calcola la dimensione di destinazione consigliata del gruppo in base al picco di carico negli ultimi 10 minuti o al periodo di inizializzazione impostato, a seconda di quale sia il periodo più lungo. Questa durata è indicata come periodo di stabilizzazione.

Osservare l'utilizzo durante il periodo di stabilizzazione aiuta il gestore della scalabilità automatica a:

  • Assicurati che le informazioni sull'utilizzo raccolte dal gruppo di istanze siano stabili.
  • Impedisci comportamenti in cui un gestore della scalabilità automatica aggiunge o rimuove continuamente istanze a una velocità eccessiva.
  • Rimuovi le istanze in modo sicuro determinando che la dimensione del gruppo più piccola è sufficiente per supportare i picchi di carico durante il periodo di stabilizzazione.
  • Se l'inizializzazione dell'applicazione su una nuova VM richiede più di 10 minuti, il gruppo utilizza il periodo di inizializzazione come periodo di stabilizzazione. Ciò garantisce che la decisione del gestore della scalabilità automatica di eliminare la VM tenga conto del tempo necessario per recuperare la capacità di distribuzione.

Il periodo di stabilizzazione potrebbe apparire come un ritardo nello scale in, ma in realtà è una funzionalità integrata della scalabilità automatica. Il periodo di stabilizzazione garantisce inoltre che, se viene aggiunta una nuova istanza al gruppo di istanze gestite, l'istanza completa il proprio periodo di inizializzazione o viene eseguita per almeno 10 minuti prima di poter essere eliminata.

I periodi di inizializzazione per le nuove istanze vengono ignorati quando decidi se scalare in un gruppo.

Lo svuotamento della connessione che causa ritardi

Se il gruppo fa parte di un servizio di backend in cui è stato abilitato lo svuotamento della connessione, la rimozione o l'eliminazione dell'istanza VM potrebbe richiedere altri 60 secondi una volta trascorso il tempo di svuotamento della connessione.

Controlli di scale in

Quando configuri i controlli di scale in del gestore della scalabilità automatica, puoi controllare la velocità di scale in. Il gestore della scalabilità automatica non scala mai più velocemente della tariffa configurata:

Gestore della scalabilità automatica con e senza controlli di scale in.

  1. Quando il carico diminuisce, il gestore della scalabilità automatica mantiene le dimensioni del gruppo al livello necessario per gestire il picco di carico osservato nel periodo di stabilizzazione. Funziona allo stesso modo, con e senza i controlli di scale in.
  2. Un gestore della scalabilità automatica senza controlli di scale in mantiene solo il numero di istanze necessarie per gestire il carico osservato di recente. Dopo il periodo di stabilizzazione, il gestore della scalabilità automatica rimuove tutte le istanze non necessarie in un solo passaggio. Un improvviso calo del carico può portare a una riduzione significativa delle dimensioni del gruppo di istanze.
  3. Un gestore della scalabilità automatica con controlli di scale in limita il numero di istanze VM che possono essere rimosse in un periodo di tempo configurato (qui, 10 VM in 20 minuti). Ciò riduce la percentuale di riduzione delle istanze.
  4. Con un nuovo picco di carico, il gestore della scalabilità automatica aggiunge nuove istanze per gestire il carico. Tuttavia, a causa dei lunghi tempi di inizializzazione, le nuove VM non sono pronte per gestire il carico. Grazie ai controlli dello scale in, è stata mantenuta la capacità precedente, consentendo alle VM esistenti di gestire il picco.

Puoi controllare la percentuale di scale in configurando la riduzione massima consentita del gestore della scalabilità automatica in una finestra temporale finale, in particolare:

  • Riduzione massima consentita (maxScaledInReplicas: numero o percentuale di istanze VM). Il numero di istanze che il tuo carico di lavoro può permettersi di perdere (dalla dimensione massima del gruppo) nell'intervallo di tempo specificato. Utilizza questo parametro per limitare il livello di scale in del gruppo, in modo da poter continuare a gestire un probabile picco di carico finché non inizi a gestire altre istanze. Più bassa è la riduzione massima consentita, minore è la frequenza di fare lo scale in.
  • Finestra temporale finale (timeWindowSec: secondi). Tempo durante il quale è probabile che un picco di carico segua un calo temporaneo e durante il quale non vuoi che le dimensioni del gruppo vengano scalate oltre la riduzione massima consentita. Utilizza questo parametro per definire la finestra temporale in cui il gestore della scalabilità automatica cercherà la dimensione massima sufficiente a gestire il carico storico. Il gestore della scalabilità automatica non verrà ridimensionato al di sotto della riduzione massima consentita sottratta dalle dimensioni massime osservate nella finestra temporale finale. Con un periodo di tempo finale più lungo, il gestore della scalabilità automatica prende in considerazione un carico di picco storico, il che rende la scalabilità in modo più conservativo e stabile.

Quando imposti i controlli di scale in, il gestore della scalabilità automatica limita le operazioni di scale in alla riduzione massima consentita dalle dimensioni di picco osservate nella finestra temporale finale. Il gestore della scalabilità automatica utilizza i seguenti passaggi:

  1. Monitora costantemente le dimensioni massime storiche osservate nella finestra temporale finale.
  2. Utilizza la riduzione massima consentita per calcolare la dimensione di scale in vincolata (dimensione massima: maxScaledInReplicas)
  3. Imposta la dimensione consigliata del gruppo sulla dimensione di scale in vincolata. Ad esempio, se un gestore della scalabilità automatica ridimensiona un gruppo di istanze a 20 VM, ma i vincoli di scale in consentono solo lo fare lo scale in di 40 VM, la dimensione consigliata è impostata su 40 VM.

Con i controlli di scale in, il gestore della scalabilità automatica monitora continuamente la dimensione massima di un gruppo di istanze all'interno della finestra temporale configurata per identificare la dimensione sufficiente per gestire il carico storico. Il gestore della scalabilità automatica non fare lo scale in oltre la riduzione massima consentita misurata dalle dimensioni dei picchi osservati:

Gestore della scalabilità automatica con controlli di scale in.

Ad esempio, nel diagramma precedente, i controlli di scale in sono configurati per una riduzione massima consentita di 20 VM in una finestra temporale di 30 minuti:

  1. Quando il carico diminuisce, il gestore della scalabilità automatica rimuove 20 VM, ovvero la riduzione massima consentita configurata nei controlli di scale in.
  2. Mentre il carico aumenta e diminuisce, il gestore della scalabilità automatica monitora costantemente la finestra temporale finale degli ultimi 30 minuti per rilevare la dimensione massima sufficiente a gestire il carico storico. La dimensione massima è utilizzata come base per i controlli di scale in del limite. Se, negli ultimi 30 minuti, la dimensione massima è stata di 70 VM e la riduzione massima consentita è impostata su 20 VM, il gestore della scalabilità automatica può fare lo scale in a 50 VM. Se la dimensione attuale è 65 VM, il gestore della scalabilità automatica può rimuoverne solo 15.
  3. Man mano che il carico diminuisce, il gestore della scalabilità automatica continua a rimuovere le istanze VM, ma limita la frequenza a un massimo di 20 VM dalla dimensione massima del gruppo di istanze misurata negli ultimi 30 minuti.

La riduzione massima consentita per le dimensioni dei gruppi può avvenire tutte insieme, quindi devi configurare la riduzione massima consentita in modo che l'applicazione possa permettere alla tua applicazione di perdere tutte quelle istanze contemporaneamente. Utilizza il parametro di riduzione massima consentita per indicare la riduzione della capacità di pubblicazione che la tua applicazione può tollerare.

Limitando il numero di istanze VM che la scalabilità automatica può rimuovere e aumentando la finestra temporale finale osservata, le applicazioni con picchi di carico e tempi di inizializzazione lunghi dovrebbero migliorare la disponibilità. In particolare, la dimensione del gruppo di istanze non diminuisce improvvisamente in risposta a un calo significativo del carico, ma diminuisce gradualmente nel tempo. Se il carico aumenta subito dopo lo fare lo scale in, il numero rimanente di VM dovrebbe comunque essere in grado di assorbire il picco entro i limiti di tolleranza. Inoltre, è necessario avviare meno VM per coprire in modo sufficiente il picco.

Puoi configurare controlli di scale in per la scalabilità automatica dei gruppi di istanze gestite a livello di zona e di regione. La configurazione è la stessa in entrambi i casi. I controlli di scale in funzionano per qualsiasi dimensione di gruppo.

Controlli di scale in e stabilizzazione del gestore della scalabilità automatica

Configurare i controlli di scale in non significa disattivare il meccanismo di stabilizzazione integrato del gestore della scalabilità automatica. Il gestore della scalabilità automatica mantiene sempre le dimensioni del gruppo di istanze al livello richiesto per gestire i picchi di carico, osservati durante il periodo di stabilizzazione. I controlli di scale in offrono un meccanismo aggiuntivo per controllare la frequenza di ridimensionamento di un gruppo di istanze.

Gestore della scalabilità automatica integrato:
Periodo di stabilizzazione
Controlli di scale in:
Finestra temporale finale
Configurabile? No, non configurabile Sì, configurabile
Che cosa viene monitorato? Monitora il carico di picco nei 10 minuti precedenti o il periodo di inizializzazione, a seconda di quale sia il periodo più lungo. Monitora la dimensione massima del gruppo di istanze nel periodo precedente impostato dalla finestra temporale finale
In che modo è utile? Garantisce che la dimensione del gruppo di istanze rimanga sufficiente per gestire il picco di carico osservato negli ultimi 10 minuti o durante il periodo di inizializzazione, a seconda di quale sia il periodo più lungo. Garantisce che le dimensioni del gruppo di istanze non vengano ridotte da un numero maggiore di istanze VM di quelle consentite dal carico di lavoro durante la gestione dei picchi di carico in un periodo di tempo specificato.

Controlli di scale in con la modalità del gestore della scalabilità automatica

Esistono due scenari simili, ma leggermente diversi, in cui il gruppo di istanze gestite non ha la scalabilità automatica e vuoi attivare la scalabilità automatica. Questi dipendono dal fatto che la scalabilità automatica sia configurata per la prima volta o se la scalabilità automatica è limitata temporaneamente o disattivata.

Configurazione del gestore della scalabilità automatica per la prima volta

Se disponi di un gruppo di istanze gestite senza scalabilità automatica e configuri la scalabilità automatica da zero, il gestore della scalabilità automatica utilizza la dimensione attuale del gruppo di istanze gestite come punto di partenza. Prima di fare lo scale in, il gestore della scalabilità automatica utilizza il periodo di stabilizzazione, quindi usa i controlli di scale in per limitare la percentuale di scale in:

Configurazione del gestore della scalabilità automatica per la prima volta in corso.

Modifica della modalità del gestore della scalabilità automatica

Con la modalità di scalabilità automatica, puoi disattivare temporaneamente o limitare le attività di scalabilità automatica. La configurazione del gestore della scalabilità automatica persiste e quest'ultimo continua a eseguire calcoli in background mentre il gestore della scalabilità automatica è disattivato o limitato. Il gestore della scalabilità automatica prende in considerazione i controlli di scale in nei propri calcoli in background quando è disattivata o in modalità con restrizioni. Tutte le attività di scalabilità automatica riprendono a utilizzare i calcoli più recenti quando riattivi la scalabilità automatica o quando rimuovi la limitazione:

Ripresa del gestore della scalabilità automatica, inclusi i controlli di scale in.

  1. Il gestore della scalabilità automatica attivato si comporta come di consueto (in questo caso i controlli di scale in).
  2. Quando disattivi il gestore della scalabilità automatica, viene comunque calcolata la dimensione consigliata del gruppo di istanze in base al carico. I calcoli del gestore della scalabilità automatica tengono ancora in considerazione i controlli di scale in. Tuttavia, il gestore della scalabilità automatica non applica i calcoli delle dimensioni quando il gestore della scalabilità automatica è disattivato. La dimensione del gruppo di istanze rimane costante fino a quando il gestore della scalabilità automatica non viene riattivato.
  3. Quando riattivi il gestore della scalabilità automatica, viene applicata immediatamente le dimensioni calcolate in precedenza. Ciò consente di scalare più rapidamente alla dimensione corretta. La riattivazione del gestore della scalabilità automatica può causare uno fare lo scale in improvviso (da 80 a 40 istanze VM). Questa soluzione è sicura perché i calcoli in background prendono già in considerazione i controlli di scale in.

Scalabilità automatica predittiva

Per saperne di più sulla scalabilità automatica predittiva, incluso come funziona, consulta Scalabilità basata sulle previsioni.

Preparazione dell'arresto delle istanze

Quando il gestore della scalabilità automatica fa lo scale in, determina il numero di istanze VM da eliminare. Il gestore della scalabilità automatica assegna la priorità all'eliminazione delle istanze VM in base a diversi fattori, tra cui:

  • VM non in esecuzione per qualsiasi motivo.
  • VM in corso o pianificate per modifiche improvvise, ad esempio aggiornamento, riavvio o sostituzione.
  • VM non ancora aggiornate alla versione prevista del modello di istanza.
  • VM con l'indicatore di scalabilità automatica più basso. Ad esempio, se configuri il gruppo di istanze gestite per la scalabilità in base all'utilizzo della CPU e il gruppo deve fare lo scale in, il gestore della scalabilità automatica tenta di rimuovere le VM con il minor utilizzo della CPU.

Prima di arrestare un'istanza, è consigliabile assicurarsi che le istanze eseguano determinate attività, come la chiusura di connessioni esistenti, l'arresto controllato di eventuali app o server delle app, caricamento dei log e così via. Puoi indicare all'istanza di eseguire queste attività utilizzando uno script di arresto anomalo. Uno script di chiusura viene eseguito secondo il best effort nel breve periodo tra il momento in cui viene effettuata la richiesta di arresto e quello in cui l'istanza viene effettivamente arrestata. Durante questo periodo, Compute Engine tenta di eseguire lo script di chiusura per eseguire le attività specificate nello script.

Questa operazione è particolarmente utile se utilizzi il bilanciamento del carico con il gruppo di istanze gestite. Se l'istanza non è integro, potrebbe essere necessario del tempo prima che il bilanciatore del carico riconosca lo stato non integro dell'istanza, di conseguenza continua a inviare nuove richieste all'istanza. Con uno script di arresto, l'istanza può segnalare che non è integro durante l'arresto, in modo che il bilanciatore del carico possa interrompere l'invio di traffico all'istanza. Per ulteriori informazioni sui controlli di integrità del bilanciamento del carico, consulta la panoramica dei controlli di integrità.

Per ulteriori informazioni sugli script di chiusura, consulta la sezione Script di arresto.

Per ulteriori informazioni sull'arresto dell'istanza, leggi la documentazione sull'stopping o sull'eliminazione di un'istanza.

Monitoraggio di grafici e log con scalabilità automatica

Compute Engine fornisce diversi grafici e log che ti consentono di monitorare il comportamento del gruppo di istanze gestite in qualsiasi momento.

Puoi accedere ai grafici e ai log nella console Google Cloud.

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome del gruppo di istanze gestite che vuoi visualizzare.
  3. Nella pagina del gruppo di istanze gestite, seleziona la scheda Monitoring.

I grafici di monitoraggio mostrano l'evoluzione delle seguenti metriche:

  • Dimensione gruppo
  • Utilizzo del gestore della scalabilità automatica
  • Utilizzo CPU
  • I/O disco (byte)
  • I/O disco (operazioni)
  • Byte di rete
  • Pacchetti di rete

Una descrizione comando accanto al titolo di ciascun grafico fornisce ulteriori dettagli contestuali sulla metrica visualizzata.

Nella parte inferiore della pagina è disponibile il riquadro Log, dove puoi trovare un elenco di log eventi per il gruppo di istanze gestite. Per visualizzare i log, fai clic sulla freccia di espansione.

Tutti i grafici e i log sono associati a un singolo intervallo di tempo che puoi personalizzare con il selettore dell'intervallo di tempo. Facendo clic su un grafico e trascinandolo, puoi aumentare lo zoom su un particolare evento e analizzare grafici e log nell'intervallo di tempo selezionato.

Monitoraggio della scalabilità automatica predittiva

Compute Engine fornisce un grafico per monitorare le previsioni del gestore della scalabilità automatica. Per visualizzare il grafico, fai clic sul titolo Dimensione del gruppo nel primo grafico e seleziona Scalabilità automatica predittiva.

Se la scalabilità automatica è abilitata, puoi visualizzare in che modo le previsioni del gestore della scalabilità automatica determinano la dimensione del gruppo di istanze. Se la scalabilità automatica non è abilitata, puoi comunque visualizzare le previsioni del gestore della scalabilità automatica e utilizzarle per prendere decisioni consapevoli sulle dimensioni del gruppo.

Utilizza le seguenti informazioni per comprendere questo grafico.

  • La riga blu indica il numero di istanze nel gruppo di istanze gestite.
  • La linea verde mostra il numero di istanze previste dal gestore della scalabilità automatica.
    • Se la linea verde si trova sotto la linea blu, significa che è disponibile una grande quantità di capacità e le tue istanze VM sono probabilmente inutilizzate.
    • Se la linea verde si trova sopra la linea blu, la capacità rimanente è scarsa o nulla e devi aggiungere altre istanze al gruppo di istanze.
  • Le linee rosse orizzontali tratteggiate indicano il numero minimo e massimo di istanze consentite nel gruppo di istanze.

Visualizzazione dei messaggi di stato

Quando il gestore della scalabilità automatica riscontra un problema di scalabilità, restituisce un avviso o un messaggio di errore. Puoi esaminare questi messaggi di stato in due modi.

Visualizza i messaggi di stato nella pagina Gruppi di istanze

Puoi visualizzare i messaggi di stato direttamente nella pagina Gruppi di istanze nella console Google Cloud.

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Cerca tutti i gruppi di istanze che presentano l'icona di attenzione prima dei nomi.

    Ad esempio:

    Messaggi di stato nella pagina dei gruppi di istanze.

  3. Tieni il puntatore del mouse su un'icona di stato per visualizzare i dettagli del messaggio di stato.

Visualizza i messaggi di stato nella pagina Panoramica del gruppo di istanze

Puoi andare direttamente alla pagina Panoramica di un gruppo di istanze specifico per visualizzare i messaggi di stato pertinenti.

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul gruppo di istanze per il quale vuoi visualizzare i messaggi di stato.
  3. Nella pagina del gruppo di istanze, visualizza il messaggio di stato sotto il nome del gruppo di istanze.

Messaggi di stato solitamente restituiti

Quando il gestore della scalabilità automatica riscontra un problema di scalabilità, restituisce un avviso o un messaggio di errore. Di seguito sono riportati alcuni messaggi comunemente restituiti e il loro significato.

All instances in the instance group are unhealthy (not in RUNNING state). If this is an error, check the instances.
Tutte le istanze nel gruppo di istanze hanno uno stato diverso da RUNNING. Se è intenzionale, puoi ignorare questo messaggio. Se questo non è intenzionale, risolvi i problemi del gruppo di istanze.
The number of instances has reached the maxNumReplicas. The autoscaler cannot add more instances.
Quando hai creato il gestore della scalabilità automatica, hai indicato il numero massimo di istanze che il gruppo di istanze può avere. Il gestore della scalabilità automatica sta attualmente tentando di fare lo scale out del gruppo di istanze per soddisfare la domanda, ma ha raggiunto maxNumReplicas. Per informazioni su come aggiornare maxNumReplicas a un numero maggiore, consulta Aggiornare un gestore della scalabilità automatica.
The monitoring metric that was specified does not exist or does not have the required labels. Check the metric.

Stai eseguendo la scalabilità automatica utilizzando una metrica di Cloud Monitoring, ma la metrica fornita non esiste, non dispone delle etichette necessarie o non è accessibile all'agente di servizio Compute Engine.

Quota for some resources is exceeded. Increase the quota or delete resources to free up more quota.

Per informazioni sulla quota disponibile, consulta la pagina delle quote della console Google Cloud.

Autoscaling does not work with an HTTP/S load balancer configured for maxRate.

È in corso il bilanciamento del carico del gruppo di istanze utilizzando la configurazione maxRate, ma il gestore della scalabilità automatica non supporta questa modalità. Modifica la configurazione o disabilita la scalabilità automatica. Per saperne di più su maxRate, leggi la sezione Restrizioni e linee guida nella documentazione sul bilanciamento del carico.

The autoscaler is configured to scale based on a load balancing signal but the instance group has not received any queries from the load balancer. Check that the load balancing configuration is working.

È in corso il bilanciamento del carico del gruppo di istanze, ma non ha query in entrata. È possibile che il servizio sia inattivo, in questo caso non c'è nulla di cui preoccuparsi. Tuttavia, questo messaggio può essere causato anche da una configurazione errata; ad esempio, un gruppo di istanze con scalabilità automatica potrebbe essere la destinazione di più di un bilanciatore del carico, che non è supportato. Per un elenco completo delle linee guida, consulta Restrizioni e linee guida nella documentazione sul bilanciamento del carico.