Se utilizzi gruppi di istanze gestite, leggi questo documento per scoprire come creare, configurare ed eliminare il ridimensionamento automatico del tuo gruppo di istanze gestite.
Prima di iniziare
-
Se non l'hai ancora fatto, configura l'autenticazione.
L'autenticazione è il processo mediante il quale la tua identità viene verificata per l'accesso a servizi e API. Google Cloud
Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:
Select the tab for how you plan to use the samples on this page:
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- Set a default region and zone.
REST
Per utilizzare gli esempi dell'API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali fornite a gcloud CLI.
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
Per ulteriori informazioni, consulta Eseguire l'autenticazione per l'utilizzo di REST nella documentazione Google Cloud sull'autenticazione.
-
Creazione di un gestore della scalabilità automatica
La creazione di un gestore della scalabilità automatica è leggermente diversa a seconda del criterio di scalabilità automatica che vuoi utilizzare. Per istruzioni sulla creazione di un gestore della scalabilità automatica, consulta:
- Scalabilità basata sull'utilizzo della CPU
- Scalabilità basata sulla capacità di gestione del bilanciamento del carico
- Scalabilità basata sulle metriche di Cloud Monitoring
- Scalabilità basata su pianificazioni
Visualizzare le informazioni su un'impostazione di scalabilità automatica
Per ulteriori informazioni su un determinato gestore della scalabilità automatica, utilizza la console, il subcomando gcloud compute instance-groups managed describe
o il metodo get
per una risorsa REST del gestore della scalabilità automatica a livello di zona o a livello di regione.
Autorizzazioni richieste per questa attività
Per eseguire questa attività, devi disporre delle seguenti autorizzazioni:
compute.autoscalers.get
sul progettocompute.instanceGroupManagers.get
sul gruppo di istanze
- Nella console Google Cloud, vai alla pagina Gruppi di istanze.
- Fai clic sul nome di un gruppo MIG nell'elenco per aprire la pagina di panoramica del gruppo.
- Fai clic su Dettagli per visualizzare i dettagli del gruppo, incluse le impostazioni di scalabilità automatica.
Utilizza il comando instance-groups managed describe
:
gcloud compute instance-groups managed describeINSTANCE_GROUP_NAME
Se al gruppo è associato un gestore della scalabilità automatica, il comando restituisce i dettagli sul gestore della scalabilità automatica:
... autoscaler: autoscalingPolicy: coolDownPeriodSec: 60 cpuUtilization: utilizationTarget: 0.6 maxNumReplicas: 20 minNumReplicas: 10 mode: ON scaleInControl: timeWindowSec: 300 maxScaledInReplicas: fixed: 3 calculated: 3 ...
Utilizza il
metodo instanceGroupManagers.get
.
Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE
con
regions/REGION
.
GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID /zones/ZONE /instanceGroupManagers/INSTANCE_GROUP_NAME
Se al gruppo è associato un gestore della scalabilità automatica, la richiesta restituisce un link alla risorsa del gestore della scalabilità automatica.
200 OK { ... "status": { ... "autoscaler": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/autoscalers/example-group" }, }
Per recuperare i dettagli sulla risorsa di scalabilità automatica, utilizza il
metodo autoscalers.get
per un gruppo di istanze gestite zonale o il
metodo regionAutoscalers.get
per un gruppo di istanze gestite a livello di regione.
GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID /zones/ZONE /autoscalers/example-autoscaler
200 OK { "kind": "compute#autoscaler", "id": "8744945839459481093", "creationTimestamp": "2018-09-28T13:02:50.553-07:00", "name": "example-group", "target": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/instanceGroupManagers/example-group", "autoscalingPolicy": { "minNumReplicas": 10, "maxNumReplicas": 20, "mode": "ON", "scaleInControl": { "timeWindowSec": 60, "maxScaledInReplicas": { "calculated": 3, "percent": 15 } }, "coolDownPeriodSec": 60, "cpuUtilization": { "utilizationTarget": 0.6 } }, "zone": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c", "selfLink": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/autoscalers/example-group", "status": "ACTIVE" }
Aggiornamento di un gestore della scalabilità automatica
Quando aggiorni un gestore della scalabilità automatica, potrebbe essere necessario del tempo per la propagazione delle modifiche e potrebbero essere necessari un paio di minuti prima che le impostazioni del nuovo gestore della scalabilità automatica vengano applicate.
Autorizzazioni richieste per questa attività
Per eseguire questa attività, devi disporre delle seguenti autorizzazioni:
compute.autoscalers.get
sul progettocompute.autoscalers.update
sul progettocompute.instanceGroupManagers.use
sul progetto
- Nella console Google Cloud, vai alla pagina Gruppi di istanze.
- Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina di panoramica del gruppo.
- Fai clic su Modifica per visualizzare e aggiornare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.
- Al termine, fai clic su Salva.
Utilizza il
comando update-autoscaling
.
gcloud compute instance-groups managed update-autoscalingINSTANCE_GROUP_NAME \ --max-num-replicasMAX_NUM ...
Per istruzioni su come creare un gestore della scalabilità automatica, consulta Creare un gestore della scalabilità automatica.
Per aggiornare una risorsa di gestione della scalabilità automatica, utilizza il metodo autoscalers.patch
per un gruppo di istanze gestite a livello di zona o il metodo regionAutoscalers.patch
per un gruppo di istanze gestite a livello di regione.
Fornisci un corpo della richiesta contenente la nuova configurazione.
PATCH https://compute.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f/autoscalers/example-autoscaler { "autoscalingPolicy": { "maxNumReplicas": 20 } }
200 OK { "kind": "compute#operation", "id": "4244494732310423322", "name": "operation-1556912627871-58800f8216ed7-74ab1720-7d360603", "zone": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f", "operationType": "compute.autoscalers.patch", "targetLink": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f/autoscalers/example-autoscaler", "targetId": "340775527929467142", "status": "RUNNING", ... }
Quando esegui richieste che modificano i dati, viene restituita una risorsa zoneOperations o regionOperations e puoi eseguire query sull'operazione per controllare lo stato della modifica.
Utilizzare la scalabilità automatica predittiva
La scalabilità automatica predittiva utilizza i dati storici per eseguire lo scale out del gruppo in anticipo rispetto al carico previsto. Funziona al meglio se il tuo carico di lavoro soddisfa i seguenti criteri:
- L'inizializzazione dell'applicazione richiede molto tempo, ad esempio se configuri un periodo di inizializzazione di più di 2 minuti.
- Il carico di lavoro varia in modo prevedibile con cicli giornalieri o settimanali.
Per ulteriori informazioni, consulta la sezione Scalabilità in base alle previsioni.
Disattivare o limitare un gestore della scalabilità automatica
Disattiva un gestore della scalabilità automatica per impedire temporaneamente di eseguire il ridimensionamento del gruppo di istanze gestite o limita il gestore della scalabilità automatica in modo che possa eseguire solo il ridimensionamento in uscita del gruppo di istanze gestite. Questa funzionalità è utile se vuoi:
- Esamina le istanze VM senza interferenze dovute alla scalabilità verso il basso.
- Riconfigura più proprietà del MIG senza che vengano attivate azioni di scalabilità mentre il gruppo è configurato solo parzialmente.
- Mantieni la capacità del gruppo di istanze gestite per un rollback rapido e reindirizza un carico di lavoro a un nuovo gruppo di istanze gestite.
- Attiva la scalabilità automatica predittiva
in un secondo momento. La scalabilità automatica predittiva richiede un criterio di scalabilità automatica per iniziare
a raccogliere la cronologia del carico su cui basare le previsioni. Lo scalare automatico rileva questa cronologia anche quando la modalità è impostata su
OFF
.
Se e quando riattivi l'autoscalabilità, questa torna automaticamente al normale funzionamento.
Segui le istruzioni riportate in questa sezione per impostare la modalità dell'autoscalatore. Sono disponibili le seguenti modalità:
- Off: disattiva temporaneamente la scalabilità automatica. Utilizza questa modalità per impedire le modifiche automatiche delle dimensioni del MIG. La configurazione della scalabilità automatica rimane invariata, quindi puoi riattivarla in un secondo momento.
- Scalabilità orizzontale solo: limita la scalabilità automatica solo all'aggiunta di nuove istanze VM. Utilizza questa modalità per proteggere il gruppo dal ridimensionamento e consentire al gruppo di eseguire il provisioning di VM aggiuntive quando il carico aumenta.
- On: abilita tutte le operazioni di scalabilità automatica in base alla relativa norma.
Autorizzazioni richieste per questa attività
Per eseguire questa attività, devi disporre delle seguenti autorizzazioni:
compute.autoscalers.get
sul progettocompute.autoscalers.update
sul progettocompute.instanceGroupManagers.use
sul progetto
- Nella console Google Cloud, vai alla pagina Gruppi di istanze.
- Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina di panoramica del gruppo.
- Fai clic su Modifica per visualizzare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.
- In Scalabilità automatica, imposta la Modalità di scalabilità automatica per disattivare o limitare la scalabilità automatica per il gruppo oppure per riattivare il gestore della scalabilità automatica.
- Al termine, fai clic su Salva.
Per disattivare, limitare o riattivare un gestore della scalabilità automatica, utilizza il comando update-autoscaling
con il flag --mode
.
gcloud compute instance-groups managed update-autoscalingINSTANCE_GROUP_NAME \ --modeMODE
Sostituisci quanto segue:
MODE
:off
per disattivare il gestore della scalabilità automatica, ma mantenere la relativa configurazioneonly-scale-out
per limitare lo scalare automatico solo all'aggiunta di istanze VMon
per riattivare tutte le attività di gestione della scalabilità automatica in base alle relative norme
Per aggiornare la modalità di una risorsa di gestione della scalabilità automatica, utilizza il
metodo autoscalers.patch
per un gruppo di istanze gestite zonale o il metodo regionAutoscalers.patch
per un gruppo di istanze gestite regionale.
Fornisci un corpo della richiesta che includa la proprietà autoscalingPolicy.mode
.
PATCH https://compute.googleapis.com/compute/v1/projects/my-project/regions/us-central1-f/autoscalers?autoscaler=my-autoscaler { "autoscalingPolicy": { "mode":"MODE " } }
Sostituisci quanto segue:
MODE
:OFF
per disattivare il gestore della scalabilità automatica, ma mantenere la relativa configurazioneONLY_SCALE_OUT
per limitare lo scalare automatico solo all'aggiunta di istanzeON
per riattivare tutte le attività di gestione della scalabilità automatica in base alle relative norme
Quando imposti la modalità di scalabilità automatica su ONLY_SCALE_OUT
, il gestore della scalabilità si comporta come segue:
- Il gestore della scalabilità automatica non riduce il valore
targetSize
del gruppo di istanze gestite indipendentemente dalle diminuzioni del carico o dalle modifiche alla configurazione del gestore della scalabilità automatica. - Se modifichi manualmente le dimensioni target di un gruppo di istanze gestite con scalabilità automatica zonale, il gestore della scalabilità automatica override le dimensioni fornite manualmente se sono inferiori a quelle consigliate dal gestore della scalabilità automatica.
- Non puoi modificare manualmente le dimensioni target di un gruppo di istanze gestite regionali.
- Se imposti il campo
autoscalingPolicy.maxNumReplicas
su un valore inferiore al valoretargetSize
corrente del gruppo mentre la modalità del gestore della scalabilità automatica è impostata suONLY_SCALE_OUT
, il gestore della scalabilità automatica non riduce il numero di istanze nel gruppo. Come di consueto, lo strumento di scalabilità automatica ricalcola continuamente le dimensioni consigliate del gruppo e potrebbe ridurle per rispettare il nuovo valore massimo, ma il gruppo non viene scalato verso il basso. - Il campo
autoscalers.status
segnala un avviso: "La scalabilità automatica opera in una modalità limitata: ONLY_SCALE_OUT".
Quando imposti la modalità del gestore della scalabilità su OFF
, il gestore della scalabilità si comporta nel seguente modo:
- Il gestore della scalabilità automatica non modifica il valore
targetSize
del gruppo di istanze gestite in risposta alle variazioni del carico o della configurazione del gestore della scalabilità automatica. Come di consueto, il gestore della scalabilità automatica calcola nuovamente continuamente le dimensioni consigliate del gruppo e potrebbe ridurle per rispettare il nuovo valore massimo, ma il gruppo non viene ridotto. - Puoi modificare manualmente le dimensioni target di un gruppo di istanze gestite di zona o regionale. I valori
minNumReplicas
emaxNumReplicas
del criterio di scalabilità automatica non influiscono sulle dimensioni impostate. - Se disattivi la scalabilità automatica per un gruppo di istanze gestite a livello di area geografica in cui è abilitata la ridistribuzione proattiva delle istanze e se il gruppo di istanze gestite ha una distribuzione non uniforme delle istanze tra le zone, il gruppo elimina o crea in modo proattivo le istanze nelle zone per ristabilire una distribuzione uniforme.
- Il campo
autoscalers.status
riporta un avviso: "La scalabilità automatica opera in una modalità limitata: OFF".
Controllare la frequenza di riduzione di un gestore della scalabilità automatica
Se sono necessari molti minuti per l'inizializzazione dei tuoi workload, configura i controlli di scale in per ridurre il rischio di latenza di risposta e interruzioni a causa di eventi di scale in improvvisi. Nello specifico, se prevedi regolarmente un picco di carico subito dopo un calo del carico, puoi limitare la frequenza di scalabilità. Il limite della frequenza di scale-in impedisce al gestore della scalabilità automatica di ridurre le dimensioni di un gruppo di istanze gestite di più istanze VM di quante il carico di lavoro possa tollerare di perdere.
Configurazione dei controlli di scale in
La configurazione dei controlli di scale in è facoltativa. Per impostazione predefinita, i controlli di scalabilità non sono configurati. Se non è configurato, lo strumento di scalabilità automatica si basa comunque sul suo meccanismo di stabilizzazione predefinito. In altre parole, mantiene le dimensioni consigliate a un livello necessario per gestire il picco di caricamento osservato durante il periodo di stabilizzazione.
Autorizzazioni richieste per questa attività
Per eseguire questa attività, devi disporre delle seguenti autorizzazioni:
compute.autoscalers.create
nel progetto per creare un gestore della scalabilità automatica.compute.autoscalers.update
nel progetto per aggiornare un gestore della scalabilità automatica.compute.instanceGroupManagers.use
sul progetto.
Per configurare i controlli di riduzione della scala per un gruppo di istanze gestite con scalabilità automatica:
Nella console Google Cloud, vai alla pagina Gruppi di istanze.
Fai clic sul nome di un gruppo di istanze gestite con scalabilità automatica nell'elenco per aprire la pagina di panoramica del gruppo.
Fai clic su Modifica per visualizzare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.
In Scalabilità automatica, fai clic su Controlli di scale in, quindi seleziona Abilita controlli di scale in.
In Non ridurre la scalabilità di più di, specifica il numero massimo o la percentuale di istanze che possono essere rimosse dal gruppo alla volta.
In Nel corso di, specifica la frequenza con cui le istanze possono essere rimosse dal gruppo.
Fai clic su Salva.
Puoi configurare i controlli di riduzione della scalabilità quando crei un'autoscalabilità o quando la aggiorni.
Configurare i controlli di riduzione della scalabilità durante la creazione di un gestore della scalabilità automatica
Imposta i controlli di riduzione della scalabilità quando crei un gestore della scalabilità automatica per un gruppo di istanze gestite utilizzando il flag --scale-in-control
con il comando gcloud
compute instance-groups managed set-autoscaling
.
Ad esempio, utilizza il seguente comando per configurare la scalabilità automatica per un
example-group
:
gcloud compute instance-groups managed set-autoscalingINSTANCE_GROUP_NAME \ --target-cpu-utilization 0.6 \ --max-num-replicas 50 \ --scale-in-control max-scaled-in-replicas=MAX_SCALE_IN_REPLICAS ,time-window=TIME_WINDOW
Configurare i controlli di riduzione della scalabilità durante l'aggiornamento di un gestore della scalabilità automatica
Aggiorna i controlli di riduzione nel gestore della scalabilità automatica esistente di un MIG utilizzando il flag --scale-in-control
con il comando gcloud compute instance-groups managed update-autoscaling
.
Ad esempio, utilizza il seguente comando per impostare i controlli di riduzione in una configurazione di scalabilità automatica esistente per example-group
:
gcloud compute instance-groups managed update-autoscalingINSTANCE_GROUP_NAME \ --scale-in-control max-scaled-in-replicas=MAX_SCALE_IN_REPLICAS ,time-window=TIME_WINDOW
Sostituisci quanto segue:
INSTANCE_GROUP_NAME
: il nome del gruppo di istanze gestite da actualizare.MAX_SCALE_IN_REPLICAS
: il numero massimo di VM che è consentito detrarre dalla dimensione del picco, preso dalla finestra temporale finale specificata. Il numero specificato di istanze VM puoi essere scalato contemporaneamente, quindi il tuo servizio dovrebbe essere in grado di permettersi di perdere così tante VM contemporaneamente. Puoi specificare un numero di VM o una percentuale. Utilizza il segno%
per le percentuali, ad esempio:50%
.TIME_WINDOW
: finestra temporale finale da cui ricavare la dimensione di picco. La scalabilità automatica non ridurrà il numero di repliche oltre il numero massimo consentito dalle dimensioni di picco registrate durante questo intervallo di tempo finale. Specifica questo valore in secondi in un intervallo [60, 3600].
Ad esempio, supponiamo di impostare l'intervallo di tempo su 1800 secondi (30 minuti). Per calcolare le dimensioni consigliate correnti per il gruppo di istanze gestite, il gestore della scalabilità automatica utilizza la seguente logica:
- Prendi le dimensioni di picco degli ultimi 30 minuti (ad esempio 100 VM)
- Prendi
max-scaled-in-replicas
(ad esempio 10 VM) - Imposta il limite inferiore delle dimensioni consigliate su: dimensioni di picco meno
max-scaled-in-replicas
(100 - 10 = 90 VM)
Configura i controlli di riduzione impostando i campi maxScaledInReplicas
e timeWindowSec
all'interno della struttura autoscalingPolicy.scaleInControl
in una risorsa di gestione della scalabilità automatica a livello di zona o
a livello di regione. Non sono previsti valori predefiniti per questi campi, devi fornire valori per entrambi i campi.
Puoi configurare i controlli di riduzione della scalabilità quando crei un'autoscalabilità o quando la aggiorni.
Configurare i controlli di riduzione della scalabilità durante la creazione di un gestore della scalabilità automatica
Per un gruppo di istanze gestite a livello di zona, utilizza il metodo autoscalers.insert
.
Per un gruppo di istanze gestite a livello di regione, utilizza il metodo regionAutoscalers.insert
.
POST https://www.googleapis.com/compute/v1/projects/PROJECT_ID /regions/REGION /autoscalers { "name": "AUTOSCALER_NAME ", "target": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID /regions/REGION /instanceGroupManagers/INSTANCE_GROUP_NAME ", "autoscalingPolicy": { "minNumReplicas": 1, "maxNumReplicas": 5, "coolDownPeriodSec": 60, "cpuUtilization": { "utilizationTarget": 0.8 }, "scaleInControl": { "maxScaledInReplicas": { "fixed":MAX_SCALE_IN_REPLICAS }, "timeWindowSec":TIME_WINDOW } } }
Per ulteriori informazioni sulla creazione di un gestore della scalabilità automatica, consulta i seguenti articoli:
- Scalabilità basata sull'utilizzo della CPU o sulla capacità di gestione del bilanciamento del carico
- Scalabilità basata sulla metrica di Cloud Monitoring.
Configurare i controlli di riduzione della scalabilità durante l'aggiornamento di un gestore della scalabilità automatica
Per un gruppo di istanze gestite a livello di zona, utilizza il metodo autoscalers.patch
.
Per un gruppo di istanze gestite a livello di regione, utilizza il metodo regionAutoscalers.patch
.
PATCH https://www.googleapis.com/compute/v1/projects/PROJECT_ID /regions/REGION /autoscalers?autoscaler=AUTOSCALER_NAME { "autoscalingPolicy": { "minNumReplicas": 1, "maxNumReplicas": 5, "coolDownPeriodSec": 60, "cpuUtilization": { "utilizationTarget": 0.8 }, "scaleInControl": { "maxScaledInReplicas": { "fixed":MAX_SCALE_IN_REPLICAS }, "timeWindowSec":TIME_WINDOW } } }
Sostituisci quanto segue:
AUTOSCALER_NAME
: il nome del gestore della scalabilità automatica da creare. Puoi assegnare un nome all'autoscalatore in base al MIG che lo utilizzerà o scegliere un altro nome.INSTANCE_GROUP_NAME
: il nome del gruppo di istanze gestite a cui aggiungere il gestore della scalabilità automatica. Per un gruppo di istanze gestite a livello di regione, sostituiscizones/ZONE
conregions/REGION
.MAX_SCALE_IN_REPLICAS
: il numero massimo di VM che è consentito detrarre dalla dimensione target consigliata per il picco, ricavata dall'intervallo di tempo finale specificato. Il numero specificato di istanze VM può essere scalato contemporaneamente, quindi il tuo servizio dovrebbe essere in grado di permettersi di perdere contemporaneamente questo numero di VM. Puoi specificare un numero di VM o una percentuale. UtilizzamaxScaledInReplicas.percentage
per specificare un valore percentuale.TIME_WINDOW
: la finestra temporale finale da cui ricavare la dimensione consigliata di picco. La scalabilità automatica non ridurrà il numero di repliche oltre il numero massimo consentito rispetto alle dimensioni consigliate per il picco rilevate durante questo intervallo di tempo finale. Specifica questo valore in secondi in un intervallo [60, 3600]; ad esempio:1800
.
Ad esempio, supponiamo di impostare l'intervallo di tempo su 1800 secondi (30 minuti). Per calcolare le dimensioni consigliate correnti per il gruppo di istanze gestite, il gestore della scalabilità automatica utilizza la seguente logica:
- Prendi le dimensioni di picco degli ultimi 30 minuti (ad esempio 100 VM)
- Prendi
max-scaled-in-replicas
(ad esempio 10 VM) - Imposta il limite inferiore delle dimensioni consigliate su: dimensioni di picco meno
max-scaled-in-replicas
(100 - 10 = 90 VM)
Per ulteriori informazioni sul funzionamento dei controlli di scale in, consulta Informazioni sulle decisioni del gestore della scalabilità automatica.
Ottenere la configurazione attuale dei controlli di scale in
Per ottenere la configurazione attuale dei controlli di riduzione, consulta Ottenere informazioni su un gestore della scalabilità automatica.
Rimuovere i controlli di scale in
Puoi rimuovere i controlli di scalabilità in per rimuovere le limitazioni relative ai tempi e alle dimensioni delle operazioni di scalabilità utilizzando Google Cloud CLI o l'API Compute Engine.
Senza i controlli di riduzione, il gestore della scalabilità automatica si basa ancora sul suo meccanismo di stabilizzazione predefinito. Nello specifico, mantiene una dimensione consigliata a un livello necessario per gestire il carico di picco, osservato durante il periodo di stabilizzazione.
Per rimuovere i controlli di scale in per un gruppo di istanze gestite con scalabilità automatica:
Nella console Google Cloud, vai alla pagina Gruppi di istanze.
Fai clic sul nome di un gruppo di istanze gestite con scalabilità automatica nell'elenco per aprire la pagina di panoramica del gruppo.
Fai clic su Modifica per visualizzare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.
In Scalabilità automatica, fai clic su Controlli di scale in, quindi deseleziona la casella di controllo Abilita controlli di scale in.
Fai clic su Salva.
Rimuovi i controlli di scalabilità interna utilizzando il flag --clear-scale-in-control
con il comando gcloud compute instance-groups managed update-autoscaling
.
Ad esempio, utilizza il seguente comando per rimuovere i controlli di riduzione della scalabilità dalla configurazione della scalabilità automatica per example-group
:
gcloud compute instance-groups managed update-autoscaling example-group \ --clear-scale-in-control
Per rimuovere i controlli di riduzione, utilizza il
metodo autoscalers.patch
per un gruppo di istanze gestite a livello di zona o il
metodo regionAutoscalers.patch
per un gruppo di istanze gestite a livello di regione,
e fornisci una configurazione vuota per i controlli di riduzione.
PATCH https://www.googleapis.com/compute/v1/projects/PROJECT_ID /zones/ZONE /autoscalers?autoscaler=AUTOSCALER_NAME { "autoscalingPolicy": { "scaleInControl": null } }
Sostituisci quanto segue:
AUTOSCALER_NAME
: il nome del gestore della scalabilità automatica da actualizare. Per ottenere un elenco dei gestori della scalabilità automatica esistenti e dei relativi MIG di destinazione, utilizza il metodoautoscalers.aggregatedList
.
Eliminazione di un gestore della scalabilità automatica
Puoi eliminare definitivamente la risorsa di adeguamento automatico e la relativa cronologia. Se vuoi interrompere temporaneamente la scalabilità automatica e mantenere la risorsa del gestore della scalabilità automatica, nonché la relativa configurazione e cronologia, disattiva il gestore della scalabilità automatica.
Autorizzazioni richieste per questa attività
Per eseguire questa attività, devi disporre delle seguenti autorizzazioni:
compute.autoscalers.delete
sul progetto
Nella console Google Cloud, vai alla pagina Gruppi di istanze.
Fai clic sul nome di un gruppo MIG nell'elenco per aprire la pagina di panoramica del gruppo.
Fai clic su Modifica per visualizzare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.
In Scalabilità automatica, dall'elenco a discesa Modalità di scalabilità automatica, seleziona Elimina configurazione della scalabilità automatica per arrestare lo scalatore automatico ed eliminare la relativa configurazione.
Al termine, fai clic su Salva.
Utilizza il comando stop-autoscaling
per interrompere un gestore della scalabilità automatica ed eliminarne la configurazione.
gcloud compute instance-groups managed stop-autoscalingINSTANCE_GROUP_NAME
L'interruzione di un gestore della scalabilità automatica ne comporta l'eliminazione dal gruppo di istanze gestite. Se vuoi riavviare il gestore della scalabilità automatica, devi ricrearlo utilizzando il comando set-autoscaling
.
Se elimini un gruppo di istanze gestite utilizzando la CLI gcloud, vengono eliminati anche eventuali gestori della scalabilità automatica associati al gruppo di istanze gestite.
Per arrestare un regolatore della scalabilità ed eliminare la relativa configurazione, utilizza il metodo autoscalers.delete
per un gruppo di istanze gestite zonale o il metodo regionAutoscalers.delete
per un gruppo di istanze gestite regionale.
DELETE https://compute.googleapis.com/compute/v1/projects/PROJECT_ID /zones/ZONE /autoscalers/AUTOSCALER_NAME
Feedback
Vogliamo conoscere i tuoi casi d'uso, le tue sfide e i tuoi feedback sull'autoscaling. Condividi il tuo feedback con il nostro team all'indirizzo mig-discuss@google.com.
Passaggi successivi
- Scopri come gli autoscaler prendono decisioni.
- Scopri come utilizzare più indicatori di scalabilità automatica per scalare il gruppo.