La scalabilità automatica aggiunge automaticamente le VM (con scale out) o rimuove le VM (con scale in) gruppo di istanze gestite. Questo documento illustra come un gestore della scalabilità automatica determina quando scalare i gruppi di istanze gestite.
In che modo i gestori della scalabilità automatica calcolano la dimensione consigliata e influiscono sulla dimensione target
Quando configuri un gestore della scalabilità automatica per un gruppo di istanze gestite, quest'ultimo monitora costantemente gruppo e imposta la dimensione consigliata per il gruppo sul numero di macchine virtuali (VM) necessarie per gestire i picchi di carico nell'istanza periodo di stabilizzazione.
La dimensione consigliata è vincolata dal numero minimo e massimo di delle istanze gestite nel criterio di scalabilità automatica.
Se il criterio di scalabilità automatica include controlli di scalabilità verso il basso, la dimensione consigliata è ulteriormente limitata dai controlli di scalabilità verso il basso.
Se attivi la scalabilità automatica predittiva, il gestore della scalabilità automatica utilizza i pattern di utilizzo della CPU storici per prevedere il carico futuro e imposta le dimensioni consigliate del gruppo in base alla previsione.
La risposta del gruppo di istanze gestite alle dimensioni consigliate dal gestore della scalabilità automatica dipende da come
configura mode
del gestore della scalabilità automatica:
ON
. Il gruppo di istanze gestite imposta la dimensione target sulla dimensione consigliata, quindi Compute Engine esegue automaticamente lo scale out del gruppo di istanze gestite per raggiungere il target dimensioni.ONLY_SCALE_OUT
. Le dimensioni target del MIG possono essere aumentate solo in risposta a un aumento delle dimensioni consigliate.OFF
. Le dimensioni target non sono interessate dalle dimensioni consigliate. Tuttavia, la dimensione consigliata viene comunque calcolata.
Se viene eliminata la configurazione del gestore della scalabilità automatica, non sono consentite dimensioni consigliate calcolato.
Differenze tra le metriche di utilizzo target e quelle effettive
Quando utilizzi un criterio di scalabilità automatica con indicatori basati su metriche, potresti notare che, per i gruppi di istanze più piccoli, l'utilizzo effettivo del gruppo di istanze e l'utilizzo target potrebbero sembrare molto distanti. Questo accade perché un gestore della scalabilità automatica agisce sempre in modo conservativo arrotondando per eccesso o per difetto quando interpreta i dati sull'utilizzo e determina quante istanze aggiungere o rimuovere. In questo modo, l'autoscalabilità non aggiunge un numero insufficiente di risorse o ne rimuove troppe.
Ad esempio, se imposti un target di utilizzo pari a 0,7 e la tua applicazione supera il target di utilizzo, il gestore della scalabilità automatica potrebbe stabilire che l'aggiunta di 1,5 istanze di macchine virtuali (VM) ridurrebbe l'utilizzo a un valore vicino a 0,7. Poiché non è possibile aggiungere 1,5 istanze VM, il gestore della scalabilità automatica lo arrotonda e aggiunge due istanze. In questo modo, l'utilizzo medio della CPU potrebbe diminuire a un valore inferiore a 0,7, ma l'app avrà risorse sufficienti per supportarlo.
Analogamente, se il gestore della scalabilità automatica determina che la rimozione di 1,5 istanze VM aumenterebbe l'utilizzo troppo vicino a 0,7, rimuoverà solo un'istanza.
Per i gruppi più grandi con più istanze VM, l'utilizzo viene suddiviso su un numero maggiore di istanze e l'aggiunta o la rimozione di istanze VM riduce il divario tra l'utilizzo effettivo e quello target.
Se utilizzi la scalabilità automatica basata su pianificazione con un altro indicatore di scalabilità automatica, una pianificazione attiva potrebbe richiedere più VM del necessario per l'utilizzo. In queste situazioni, l'utilizzo effettivo è inferiore all'utilizzo target perché la pianificazione della scalabilità automatica determina la dimensione consigliata del gruppo di istanze.
Ritardi nell'eseguire lo scale out
Quando configuri la scalabilità automatica, devi specificare periodo di inizializzazione che riflette il tempo necessario per l'inizializzazione delle VM. Il gestore della scalabilità automatica consiglia di fare lo scale out solo se l'utilizzo medio da istanze che se non viene inizializzata è maggiore dell'utilizzo target.
Se imposti un valore del periodo di inizializzazione notevolmente più lungo rispetto necessario per inizializzare un'istanza, il gestore della scalabilità automatica potrebbe sull'utilizzo legittimo e potrebbe sottovalutare la dimensione richiesta nel tuo gruppo.
Ritardi nello scale in
Ai fini dello scale in, il gestore della scalabilità automatica calcola i dimensione target consigliata in base al picco di carico negli ultimi 10 minuti oppure il periodo di inizializzazione in cui impostato, a seconda di quale sia il periodo più lungo. Questa durata è indicata come periodo di stabilizzazione.
Conoscere l'utilizzo durante il periodo di stabilizzazione aiuta il gestore della scalabilità automatica a:
- Assicurati che le informazioni sull'utilizzo raccolte dal gruppo di istanze siano stabili.
- Impedisci i comportamenti in cui un gestore della scalabilità automatica aggiunge o rimuove continuamente istanze una tariffa eccessiva.
- Rimuovi le istanze in sicurezza determinando che il numero inferiore di istanze è sufficiente per supportare il picco di carico del periodo di stabilizzazione.
- Se l'inizializzazione dell'applicazione su una nuova VM richiede più di 10 minuti, il gruppo utilizza il periodo di inizializzazione come periodo di stabilizzazione. In questo modo, la decisione del gestore della scalabilità automatica di eliminare la VM tenga conto di come il tempo necessario per recuperare la capacità di pubblicazione.
Il periodo di stabilizzazione potrebbe sembrare un ritardo nella riduzione, ma in realtà è una funzionalità integrata della scalabilità automatica. Il periodo di stabilizzazione assicura che, se una nuova istanza viene aggiunta al gruppo di istanze gestite, di inizializzazione o che abbia una durata minima di 10 minuti prima di essere idoneo per essere eliminati.
Periodi di inizializzazione per le nuove istanze vengono ignorate al momento di decidere se scalare in un gruppo.
Lo svuotamento della connessione causa ritardi
Se il gruppo fa parte di un servizio di backend ha attivato lo svuotamento della connessione, lo svuotamento della connessione può richiedere fino a 60 secondi in più è trascorsa prima che l'istanza VM venga rimossa o eliminata.
Controlli di scale in
Quando configuri i controlli di scale in del gestore della scalabilità automatica, puoi controllare la velocità dello scale in. Lo strumento di scalabilità automatica non esegue mai lo scale up più rapidamente della frequenza configurata:
- Quando il carico diminuisce, il gestore della scalabilità automatica mantiene le dimensioni del gruppo a un livello necessario per gestire il picco di carico osservato nella (stabilizzazione punto). Funziona allo stesso modo, con e senza controlli di scale in.
- Un gestore della scalabilità automatica senza controlli di scale in mantiene solo il numero sufficiente di istanze per gestire il carico osservato di recente. Al termine del periodo di stabilizzazione, il lo strumento di scalabilità automatica rimuove tutte le istanze non necessarie in un solo passaggio. Un improvviso calo del carico può comportare una drastica riduzione delle dimensioni del gruppo di istanze.
- Un gestore della scalabilità automatica con controlli di scale in limita il numero di istanze VM che possono essere rimosso in un periodo di tempo configurato (qui 10 VM in 20 minuti). Ciò rallenta il tasso di riduzione delle istanze.
- Con un nuovo picco di carico, il gestore della scalabilità automatica aggiunge nuove istanze per gestire caricamento. Tuttavia, a causa dei lunghi tempi di inizializzazione, le nuove VM non sono pronte per gestire il carico. Con i controlli di ridimensionamento verso l'interno, la capacità precedente è stata mantenuta, consentendo alle VM esistenti di gestire il picco.
Puoi controllare la frequenza di riduzione configurando la riduzione massima consentita del gestore della scalabilità automatica in un intervallo di tempo successivo, in particolare:
- Riduzione massima consentita (
maxScaledInReplicas
: numero o percentuale di istanze VM). Il numero di istanze che il tuo carico di lavoro può permettersi di perdere (dalle dimensioni massime del gruppo) nell'intervallo di tempo successivo specificato. Utilizza questo parametro per limitare la scalabilità del gruppo in modo da poter gestire un probabile picco di carico finché non vengono avviate altre istanze. Quanto più ridotta è la riduzione massima consentita, più lento sarà il tasso di aumento. - Finestra temporale finale (
timeWindowSec
: secondi). Periodo durante il quale è probabile che un picco di carico sia seguito da un calo temporaneo e durante il quale Non vuoi che le dimensioni del tuo gruppo aumentino oltre il limite massimo consentito. e la riduzione del traffico. Utilizza questo parametro per definire l'intervallo di tempo in cui il gestore della scalabilità automatica cercherà la dimensione massima sufficiente per gestire il carico storico. Il gestore della scalabilità automatica non ridimensiona al di sotto della riduzione massima consentita sottratta rispetto alla dimensione massima osservata nella finestra temporale finale. Con un finale, il gestore della scalabilità automatica considera i picchi storici il che rende la scalabilità in un ambiente più conservativo e stabile.
Quando imposti i controlli di scale in, il gestore della scalabilità automatica vincola le operazioni di scale in alla riduzione massima consentita rispetto alla dimensione del picco osservata nella parte finale finestra temporale. Il gestore della scalabilità automatica utilizza i seguenti passaggi:
- Monitora costantemente la dimensione del picco storico osservato nella finestra temporale precedente.
- Utilizza la riduzione massima consentita per calcolare il
dimensione di scale in vincolata (dimensione massima:
maxScaledInReplicas
) - Imposta la dimensione consigliata del gruppo sulle dimensioni di scalabilità in basso vincolate. Ad esempio, se un gestore della scalabilità automatica ridimensiona un gruppo di istanze in modo da avere 20 VM, ma i vincoli di scalabilità in consentono solo di scalare fino a 40 VM, la dimensione consigliata è impostata su 40 VM.
Con i controlli di scalabilità verso il basso, il gestore della scalabilità automatica monitora continuamente le dimensioni di picco di un gruppo di istanze all'interno della finestra temporale finale configurata per identificare le dimensioni sufficienti per soddisfare il carico storico. Il gestore della scalabilità automatica non esegue lo scale in oltre la riduzione massima consentita misurata in base alle dimensioni del picco osservate:
Ad esempio, nel diagramma sopra, i controlli di scalabilità in diminuzione sono configurati per una riduzione massima consentita di 20 VM in un intervallo di tempo successivo di 30 minuti:
- Quando il carico diminuisce, il gestore della scalabilità automatica rimuove 20 VM, ovvero la riduzione massima consentita configurata nei controlli di scale-in.
- Man mano che il carico aumenta e diminuisce, il gestore della scalabilità automatica monitora costantemente le ultime 30 finestra di tempo finale di minuti per il picco sufficienti per gestire il carico storico. Questa dimensione di picco viene utilizzata come base per i controlli di scalabilità in calo per limitare la frequenza di scalabilità in calo. Se negli ultimi 30 minuti la dimensione di picco era di 70 VM e la riduzione massima consentita è impostata su 20 VM, il gestore della scalabilità automatica può eseguire la scalabilità verso il basso fino a 50 VM. Se la dimensione attuale è di 65 VM, il lo strumento di scalabilità automatica può rimuovere solo 15 VM.
- Quando il carico diminuisce, il gestore della scalabilità automatica continua a rimuovere le istanze VM, ma limita la frequenza a un massimo di 20 VM rispetto alla dimensione massima del gruppo di istanze misurata negli ultimi 30 minuti.
La riduzione massima consentita del gruppo potrebbe avvenire contemporaneamente, quindi devi configurare la riduzione massima consentita in modo che la tua applicazione possa permettersi di perdere così tante istanze contemporaneamente. Utilizza la riduzione massima consentita per indicare la riduzione della capacità di distribuzione dell'applicazione possono tollerare.
Limitando il numero di istanze VM che la scalabilità automatica può rimuovere e tramite aumentando la finestra temporale osservata, le applicazioni con picchi di carico e tempi di inizializzazione lunghi dovrebbero registrare una maggiore disponibilità. Nella in particolare, la dimensione del gruppo di istanze non cala bruscamente in risposta a un un calo significativo del carico, che invece diminuisce gradualmente nel tempo. Se i picchi di carico si verificano subito dopo una riduzione della scalabilità, il numero rimanente di VM dovrebbe essere ancora in grado di assorbire il picco entro i limiti di tolleranza. Inoltre, meno VM deve essere avviato per poter gestire in modo sufficiente il picco.
Puoi configurare i controlli di riduzione della scala per la scalabilità automatica sia dei MIG zonali sia di quelli regionali. La configurazione è la stessa per entrambi i casi. Scale in funzionano per gruppi di qualsiasi dimensione.
Controlli di scale in rispetto alla stabilizzazione del gestore della scalabilità automatica
La configurazione dei controlli di scale-in non comporta la disattivazione del meccanismo di stabilizzazione integrato dell'autoscalabilità. Il gestore della scalabilità automatica mantiene sempre le dimensioni del gruppo di istanze a un livello necessario per gestire il carico di picco, osservato durante il periodo di stabilizzazione. Controlli di scale in un meccanismo aggiuntivo per controllare il tasso in cui un gruppo di istanze viene ridimensionato.
Autoscaler integrato: Periodo di stabilizzazione |
Controlli di scala in: Finestra temporale finale |
|
---|---|---|
Configurabile? | No, non configurabile | Sì, configurabile |
Che cosa viene monitorato? | Monitora il carico di picco degli ultimi 10 minuti o la di inizializzazione, a seconda di quale sia più lungo. | Monitora la dimensione massima del gruppo di istanze nel periodo precedente impostato in base alla finestra temporale finale |
In che modo può essere utile? | Garantisce che la dimensione del gruppo di istanze rimanga sufficiente per gestire il picco osservato durante gli ultimi 10 minuti o di inizializzazione, a seconda di quale sia più lungo. | Garantisce che le dimensioni del gruppo di istanze non vengano ridotte di più istanze VM di quante il tuo carico di lavoro possa tollerare durante la gestione degli picchi di caricamento in un determinato periodo di tempo. |
Controlli di scale in con la modalità del gestore della scalabilità automatica
Esistono due scenari simili, ma leggermente diversi, quando il MIG non è sottoposto a ridimensionamento automatico e vuoi attivare questa funzionalità. Questi aspetti dipendono dal fatto che tu o se configuri la scalabilità automatica per la prima volta configurato ma temporaneamente limitate o disattivate.
Configurare l'autoscaler per la prima volta
Quando hai un gruppo di istanze gestite non sottoposto a scalabilità automatica e configuri la scalabilità automatica da zero, il gestore della scalabilità automatica utilizza le dimensioni correnti del gruppo di istanze gestite come punto di partenza. Prima di fare lo scale in, il gestore della scalabilità automatica utilizza il periodo di stabilizzazione e poi i controlli di scale in vincolare il tasso di scale in:
Modifica della modalità del gestore della scalabilità automatica
Con la modalità di scalabilità automatica, puoi disattivare o limitare temporaneamente le attività di scalabilità automatica. La La configurazione del gestore della scalabilità automatica persiste e continua a funzionare i calcoli in background quando il gestore della scalabilità automatica è disattivato o limitato. Il modulo di scalabilità automatica prende in considerazione i controlli di riduzione della scalabilità nei calcoli in background in modalità off o con restrizioni. Tutte le attività di scalabilità automatica riprendono a utilizzare i calcoli più recenti quando riattivi la scalabilità automatica o quando rimuovi la restrizione:
- Il gestore della scalabilità automatica su ON funziona come al solito (in questo caso con i controlli di scale in).
- Quando disattivi il ridimensionamento automatico, questo calcola comunque la dimensione consigliata del gruppo di istanze in base al carico. I calcoli del gestore della scalabilità automatica continuano a considerare lo scale in i controlli di sicurezza. Tuttavia, il gestore della scalabilità automatica non applica i calcoli delle dimensioni quando il gestore della scalabilità automatica non è attivo. La dimensione del gruppo di istanze rimane costante fino a quando il gestore della scalabilità automatica è di nuovo ON.
- Quando riattivi il gestore della scalabilità automatica, viene applicato immediatamente dimensione calcolata. In questo modo, puoi scalare più rapidamente alle dimensioni corrette. Riattivazione in corso... il gestore della scalabilità automatica può causare uno fare lo scale in repentino (qui da 80 a 40 VM . Questo è sicuro perché i calcoli in background prendono già in considerazione i controlli di scalabilità.
Scalabilità automatica predittiva
Per saperne di più sulla scalabilità automatica predittiva, inclusi come funziona, vedi Scalabilità basata sulle previsioni.
Preparazione dell'arresto delle istanze
Quando fa lo scale in del gestore della scalabilità automatica, determina il numero di istanze VM eliminare. Il gestore della scalabilità automatica assegna la priorità alle istanze VM da eliminare in base a diverse tra cui:
- VM non in esecuzione per qualsiasi motivo.
- VM in fase di modifica o pianificate per modifiche improvvise, ad esempio aggiornare, riavviare o sostituire.
- VM che non sono ancora aggiornate alla versione prevista del modello di istanza.
- VM con l'indicatore di scalabilità automatica più basso. Ad esempio, se configuri del tuo gruppo di istanze gestite in base all'utilizzo della CPU e il gruppo deve fare lo scale in, il gestore della scalabilità automatica tenterà di rimuovere le VM con il numero di CPU più basso all'utilizzo delle risorse.
Prima di un'istanza viene arrestato, ti consigliamo di assicurarti che queste istanze eseguano come la chiusura di connessioni esistenti, l'arresto controllato app o server delle app, caricare log e così via. Puoi indica all'istanza di eseguire queste attività utilizzando un script di arresto. Uno script di arresto viene eseguito su base best effort nel breve periodo tra il momento in cui viene effettuata la richiesta di arresto e il momento in cui l'istanza viene effettivamente arrestata. Durante questo periodo, Compute Engine tenta di eseguire lo script di chiusura per eseguire le attività che fornisci nello script.
Questa opzione è particolarmente utile se utilizzi il bilanciamento del carico con il gruppo di istanze gestite. Se l'istanza non è più in stato di integrità, potrebbe essere necessario del tempo prima che il bilanciatore del carico lo riconosca e continui a inviare nuove richieste all'istanza. Con uno script di arresto, l'istanza può segnalare che non è in stato di salute durante l'arresto in modo che il bilanciatore del carico possa interrompere l'invio di traffico all'istanza. Per per ulteriori informazioni sui controlli di integrità del bilanciamento del carico, consulta panoramica dei controlli di integrità.
Per ulteriori informazioni sugli script di arresto, consulta Script di arresto.
Per saperne di più sull'arresto dell'istanza, leggi la documentazione su stop o eliminazione di un'istanza.
Monitoraggio di grafici e log della scalabilità automatica
Compute Engine fornisce diversi grafici e log che ti consentono di monitorare il comportamento del gruppo di istanze gestite in qualsiasi momento.
Puoi accedere ai grafici e ai log nella console Google Cloud.
- Nella console Google Cloud, vai alla pagina Gruppi di istanze.
- Fai clic sul nome del gruppo di istanze gestite che vuoi visualizzare.
- Nella pagina del gruppo di istanze gestite, seleziona la scheda Monitoraggio.
I grafici di monitoraggio mostrano l'evoluzione delle seguenti metriche:
- Dimensione gruppo
- Utilizzo della scalabilità automatica
- Utilizzo CPU
- I/O disco (byte)
- I/O disco (operazioni)
- Byte di rete
- Pacchetti di rete
Una descrizione comando accanto al titolo di ogni grafico fornisce dettagli aggiuntivi contestuali sulla metrica visualizzata.
Nella parte inferiore della pagina è disponibile il riquadro Log, dove puoi trovare un dei log eventi del tuo gruppo di istanze gestite. Per visualizzare i log, fai clic su la freccia di espansione.
Tutti i grafici e i log sono associati a un unico periodo di tempo che puoi personalizzare con il selettore dell'intervallo di tempo. Facendo clic e trascinando su un grafico, puoi aumentare lo zoom su un determinato evento e analizzare i grafici e i log nell'intervallo di tempo selezionato.
Monitoraggio della scalabilità automatica predittiva
Compute Engine fornisce un grafico per monitorare le previsioni dell'autoscalabilità. Per visualizzare il grafico, fai clic sul titolo Dimensione del gruppo nel primo grafico e Seleziona Scalabilità automatica predittiva.
Se la scalabilità automatica è abilitata, puoi visualizzare il modo in cui le previsioni del gestore della scalabilità automatica determinano la dimensione del gruppo di istanze. Se la scalabilità automatica non è attivata, puoi comunque visualizzare le previsioni del gestore della scalabilità automatica e usarle per prendere decisioni in merito alle dimensioni del gruppo.
Utilizza le seguenti informazioni per comprendere questo grafico.
- La linea blu indica il numero di istanze nel gruppo di istanze gestite.
- La linea verde mostra il numero di istanze previste dal gestore della scalabilità automatica.
- Se la linea verde si trova sotto la linea blu, c'è di capacità elevata e probabilmente le tue istanze VM sottoutilizzati.
- Se la linea verde si trova sopra la linea blu, c'è solo una capacità rimanente e dovrai aggiungere altre istanze all'istanza gruppo.
- Le linee rosse orizzontali tratteggiate indicano il numero minimo e massimo di istanze consentite nel gruppo di istanze.
Visualizzazione dei messaggi di stato
Quando si verifica un problema di scalabilità, il gestore della scalabilità automatica restituisce un avviso . Puoi esaminare questi messaggi di stato in due modi.
Visualizza i messaggi di stato nella pagina Gruppi di istanze
Puoi visualizzare i messaggi di stato direttamente nella pagina Gruppi di istanze della console Google Cloud.
- Nella console Google Cloud, vai alla pagina Gruppi di istanze.
Cerca tutti i gruppi di istanze con l'icona di attenzione prima i nomi degli utenti.
Ad esempio:
Tieni premuto il cursore sopra un'icona di stato per visualizzare i dettagli del messaggio di stato.
Visualizza i messaggi di stato nella pagina Panoramica del gruppo di istanze
Puoi andare direttamente alla pagina di riepilogo di un gruppo di istanze specifico per visualizzare i messaggi di stato pertinenti.
- Nella console Google Cloud, vai alla pagina Gruppi di istanze.
- Fai clic sul gruppo di istanze per cui vuoi visualizzare i messaggi di stato.
- Nella pagina del gruppo di istanze, visualizza il messaggio di stato sotto il gruppo di istanze nome.
Messaggi di stato restituiti più spesso
Quando lo scalatore automatico riscontra un problema di scalabilità, restituisce un messaggio di avviso o di errore. Di seguito sono riportati alcuni messaggi restituiti di frequente e il loro significato.
All instances in the instance group are unhealthy (not in RUNNING state). If this is an error, check the instances.
- Tutte le istanze del gruppo di istanze hanno uno stato diverso da
RUNNING
. Se si tratta di un'azione intenzionale, puoi ignorare questo messaggio. Se questa è una scelta non intenzionale, risolvi il problema del gruppo di istanze. The number of instances has reached the maxNumReplicas. The autoscaler cannot add more instances.
- Quando hai creato il gestore della scalabilità automatica, hai indicato il numero massimo di istanze che il gruppo di istanze può avere. Il gestore della scalabilità automatica sta tentando
fare lo scale out del gruppo di istanze per soddisfare la domanda, ma ha raggiunto
maxNumReplicas
. Per informazioni su come aggiornaremaxNumReplicas
a un numero maggiore, consulta Aggiornare un gestore della scalabilità automatica. The monitoring metric that was specified does not exist or does not have the required labels. Check the metric.
Stai utilizzando la scalabilità automatica con una metrica di Cloud Monitoring, ma la metrica che hai fornito non esiste, non dispone delle etichette necessarie o non è accessibile all'agente di servizio Compute Engine.
- A seconda che la metrica sia standard o metrica personalizzata, etichette diverse sono obbligatori. Consulta la documentazione per Scalabilità in base a una metrica di Monitoring per ulteriori informazioni.
- Verifica che l'agente di servizio Compute Engine disponga del ruolo IAM
compute.serviceAgent
. Per aggiungerlo, consulta Prerequisiti del gestore della scalabilità automatica.
- Verifica che l'agente di servizio Compute Engine disponga del ruolo IAM
Quota for some resources is exceeded. Increase the quota or delete resources to free up more quota.
Puoi ottenere informazioni sulla quota disponibile nella Pagina delle quote nella console Google Cloud.
Autoscaling does not work with an HTTP/S load balancer configured for maxRate.
È in corso il bilanciamento del carico del gruppo di istanze utilizzando la configurazione
maxRate
ma non supporta questa modalità. Modifica la configurazione o disattiva la scalabilità automatica. Per scoprire di più sumaxRate
, leggi la sezione Limitazioni e linee guida nella documentazione sul bilanciamento del carico.The autoscaler is configured to scale based on a load balancing signal but the instance group has not received any queries from the load balancer. Check that the load balancing configuration is working.
È in corso il bilanciamento del carico del gruppo di istanze, ma non ha traffico in entrata query. Il servizio potrebbe essere inattivo, ma non c'è da preoccuparsi. Tuttavia, questo messaggio può essere causato anche configurazione errata; Ad esempio, un gruppo di istanze con scalabilità automatica di più di un bilanciatore del carico, il che non è supportato. Per un elenco completo delle linee guida, consulta Limitazioni e linee guida nella documentazione sul bilanciamento del carico.