Utilizzo dei gestori della scalabilità automatica


Se utilizzi gruppi di istanze gestite (MIG), leggi questo documento per scoprire come creare, configurare ed eliminare il ridimensionamento automatico del MIG.

Prima di iniziare

  • Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione è la procedura mediante la quale la tua identità viene verificata per l'accesso alle API e ai servizi Google Cloud. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Install the Google Cloud CLI, then initialize it by running the following command:

      gcloud init
    2. Set a default region and zone.
    3. REST

      Per utilizzare gli esempi dell'API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali fornite a gcloud CLI.

        Install the Google Cloud CLI, then initialize it by running the following command:

        gcloud init

      Per ulteriori informazioni, consulta Eseguire l'autenticazione per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud.

Creazione di un gestore della scalabilità automatica

La creazione di un gestore della scalabilità automatica è leggermente diversa a seconda del criterio di scalabilità automatica che vuoi utilizzare. Per istruzioni sulla creazione di un gestore della scalabilità automatica, consulta:

Visualizzare le informazioni su un'impostazione di scalabilità automatica

Per ulteriori informazioni su un determinato gestore della scalabilità automatica, utilizza la console, il subcomando gcloud compute instance-groups managed describe o il metodo get per una risorsa REST del gestore della scalabilità automatica a livello di zona o a livello di regione.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo MIG nell'elenco per aprire la pagina di panoramica del gruppo.
  3. Fai clic su Dettagli per visualizzare i dettagli del gruppo, incluse le impostazioni di scalabilità automatica.

gcloud

Utilizza il comando instance-groups managed describe:

gcloud compute instance-groups managed describe INSTANCE_GROUP_NAME

Se al gruppo è associato un gestore della scalabilità automatica, il comando restituisce i dettagli sul gestore della scalabilità automatica:

...
autoscaler:
  autoscalingPolicy:
    coolDownPeriodSec: 60
    cpuUtilization:
      utilizationTarget: 0.6
    maxNumReplicas: 20
    minNumReplicas: 10
    mode: ON
    scaleInControl:
      timeWindowSec: 300
      maxScaledInReplicas:
        fixed: 3
        calculated: 3
...

REST

Utilizza il metodo instanceGroupManagers.get. Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE con regions/REGION.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME

Se al gruppo è associato un gestore della scalabilità automatica, la richiesta restituisce un link alla risorsa del gestore della scalabilità automatica.

200 OK

{
  ...
  "status": {
    ...
    "autoscaler": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/autoscalers/example-group"
  },
}

Per recuperare i dettagli sulla risorsa di scalabilità automatica, utilizza il metodo autoscalers.get per un gruppo di istanze gestite zonale o il metodo regionAutoscalers.get per un gruppo di istanze gestite a livello di regione.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/example-autoscaler
200 OK

{
 "kind": "compute#autoscaler",
 "id": "8744945839459481093",
 "creationTimestamp": "2018-09-28T13:02:50.553-07:00",
 "name": "example-group",
 "target": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/instanceGroupManagers/example-group",
 "autoscalingPolicy": {
  "minNumReplicas": 10,
  "maxNumReplicas": 20,
  "mode": "ON",
  "scaleInControl": {
    "timeWindowSec": 60,
    "maxScaledInReplicas": {
      "calculated": 3,
      "percent": 15
    }
  },
  "coolDownPeriodSec": 60,
  "cpuUtilization": {
   "utilizationTarget": 0.6
  }
 },
 "zone": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c",
 "selfLink": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/autoscalers/example-group",
 "status": "ACTIVE"
}

Aggiornamento di un gestore della scalabilità automatica

Quando aggiorni un gestore della scalabilità automatica, potrebbe essere necessario del tempo per la propagazione delle modifiche e potrebbero essere necessari un paio di minuti prima che le impostazioni del nuovo gestore della scalabilità automatica vengano applicate.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo MIG nell'elenco per aprire la pagina di panoramica del gruppo.
  3. Fai clic su Modifica per visualizzare e aggiornare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.
  4. Al termine, fai clic su Salva.

gcloud

Utilizza il comando update-autoscaling.

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
        --max-num-replicas MAX_NUM ...

Per istruzioni su come creare un gestore della scalabilità automatica, consulta Creare un gestore della scalabilità automatica.

REST

Per aggiornare una risorsa di gestione della scalabilità automatica, utilizza il metodo autoscalers.patch per un gruppo di istanze gestite a livello di zona o il metodo regionAutoscalers.patch per un gruppo di istanze gestite a livello di regione. Fornisci un corpo della richiesta contenente la nuova configurazione.

PATCH https://compute.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f/autoscalers/example-autoscaler

{
 "autoscalingPolicy": {
  "maxNumReplicas": 20
 }
}
200 OK

{
 "kind": "compute#operation",
 "id": "4244494732310423322",
 "name": "operation-1556912627871-58800f8216ed7-74ab1720-7d360603",
 "zone": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f",
 "operationType": "compute.autoscalers.patch",
 "targetLink": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f/autoscalers/example-autoscaler",
 "targetId": "340775527929467142",
 "status": "RUNNING",
 ...
}

Quando esegui richieste che modificano i dati, viene restituita una risorsa zoneOperations o regionOperations e puoi eseguire query sull'operazione per controllare lo stato della modifica.

Utilizzare la scalabilità automatica predittiva

La scalabilità automatica predittiva utilizza i dati storici per eseguire lo scale out del gruppo prima del carico previsto. Funziona al meglio se il tuo carico di lavoro soddisfa i seguenti criteri:

  • L'inizializzazione dell'applicazione richiede molto tempo, ad esempio se configuri un periodo di inizializzazione di più di 2 minuti.
  • Il carico di lavoro varia in modo prevedibile con cicli giornalieri o settimanali.

Per ulteriori informazioni, consulta la sezione Scalabilità in base alle previsioni.

Disattivare o limitare un gestore della scalabilità automatica

Disattiva un gestore della scalabilità automatica per impedire temporaneamente di eseguire il ridimensionamento del gruppo di istanze gestite o limita il gestore della scalabilità automatica in modo che possa eseguire solo il ridimensionamento in uscita del gruppo di istanze gestite. Questa funzionalità è utile se vuoi:

  • Esamina le istanze VM senza interferenze dovute alla scalabilità verso il basso.
  • Riconfigura più proprietà del gruppo di istanze gestite senza che vengano attivate azioni di scalabilità mentre il gruppo è configurato solo parzialmente.
  • Mantieni la capacità del gruppo di istanze gestite per un rollback rapido e reindirizza un workload a un nuovo gruppo di istanze gestite.
  • Attiva la scalabilità automatica predittiva in un secondo momento. La scalabilità automatica predittiva richiede un criterio di scalabilità automatica per iniziare a raccogliere la cronologia del carico su cui basare le previsioni. Lo scalare automatico rileva questa cronologia anche quando la modalità è impostata su OFF.

Se e quando riattivi l'autoscalabilità, questa torna automaticamente al normale funzionamento.

Segui le istruzioni riportate in questa sezione per impostare la modalità dell'autoscalatore. Sono disponibili le seguenti modalità:

  • Off: disattiva temporaneamente la scalabilità automatica. Utilizza questa modalità per impedire le modifiche automatiche delle dimensioni del MIG. La configurazione della scalabilità automatica rimane invariata, quindi puoi riattivarla in un secondo momento.
  • Solo scalabilità orizzontale: limita la scalabilità automatica solo all'aggiunta di nuove istanze VM. Utilizza questa modalità per proteggere il gruppo dal ridimensionamento e per consentire al gruppo di eseguire il provisioning di VM aggiuntive quando il carico aumenta.
  • On: abilita tutte le operazioni di scalabilità automatica in base alla relativa norma.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo MIG nell'elenco per aprire la pagina di panoramica del gruppo.
  3. Fai clic su Modifica per visualizzare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.
  4. In Scalabilità automatica, imposta la Modalità di scalabilità automatica per disattivare o limitare la scalabilità automatica per il gruppo oppure per riattivare il gestore della scalabilità automatica.
  5. Al termine, fai clic su Salva.

gcloud

Per disattivare, limitare o riattivare un gestore della scalabilità automatica, utilizza il comando update-autoscaling con il flag --mode.

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
        --mode MODE 

Sostituisci quanto segue:

  • MODE:
    • off per disattivare il gestore della scalabilità automatica, ma mantenere la relativa configurazione
    • only-scale-out per limitare lo scalare automatico all'aggiunta solo di istanze VM
    • on per riattivare tutte le attività di gestione della scalabilità automatica in base alle relative norme

REST

Per aggiornare la modalità di una risorsa di gestione della scalabilità automatica, utilizza il metodo autoscalers.patch per un gruppo di istanze gestite zonale o il metodo regionAutoscalers.patch per un gruppo di istanze gestite regionale. Fornisci un corpo della richiesta che includa la proprietà autoscalingPolicy.mode.

PATCH https://compute.googleapis.com/compute/v1/projects/my-project/regions/us-central1-f/autoscalers?autoscaler=my-autoscaler

{
  "autoscalingPolicy": {
    "mode":"MODE"
  }
}

Sostituisci quanto segue:

  • MODE:
    • OFF per disattivare il gestore della scalabilità automatica, ma mantenere la relativa configurazione
    • ONLY_SCALE_OUT per limitare lo scalare automatico solo all'aggiunta di istanze
    • ON per riattivare tutte le attività di gestione della scalabilità automatica in base alle relative norme

Quando imposti la modalità di scalabilità automatica su ONLY_SCALE_OUT, il gestore della scalabilità si comporta come segue:

  • Il gestore della scalabilità automatica non riduce il valore targetSize del gruppo di istanze gestite indipendentemente dalle diminuzioni del carico o dalle modifiche alla configurazione del gestore della scalabilità automatica.
  • Se modifichi manualmente le dimensioni target di un gruppo di istanze gestite con scalabilità automatica zonale, il gestore della scalabilità automatica sostituisce le dimensioni fornite manualmente se sono inferiori a quelle consigliate dal gestore della scalabilità automatica.
  • Non puoi modificare manualmente le dimensioni target di un gruppo di istanze gestite regionali.
  • Se imposti il campo autoscalingPolicy.maxNumReplicas su un valore inferiore al valore targetSize corrente del gruppo mentre la modalità del gestore della scalabilità automatica è impostata su ONLY_SCALE_OUT, il gestore della scalabilità automatica non riduce il numero di istanze nel gruppo. Come di consueto, lo strumento di scalabilità automatica ricalcola continuamente le dimensioni consigliate del gruppo e potrebbe ridurle per rispettare il nuovo valore massimo, ma il gruppo non viene scalato verso il basso.
  • Il campo autoscalers.status segnala un avviso: "La scalabilità automatica opera in una modalità limitata: ONLY_SCALE_OUT".

Quando imposti la modalità del gestore della scalabilità su OFF, il gestore della scalabilità si comporta nel seguente modo:

  • Il gestore della scalabilità automatica non modifica il valore targetSize del gruppo di istanze gestite in risposta alle variazioni del carico o della configurazione del gestore della scalabilità automatica. Come di consueto, il gestore della scalabilità automatica calcola continuamente la dimensione consigliata del gruppo e potrebbe diminuirla per rispettare il nuovo valore massimo, ma il gruppo non viene ridotto.
  • Puoi modificare manualmente le dimensioni target di un gruppo di istanze gestite di zona o regionale. I valori minNumReplicas e maxNumReplicas del criterio di scalabilità automatica non influiscono sulle dimensioni impostate.
  • Se disattivi la scalabilità automatica per un gruppo di istanze gestite a livello di area geografica in cui è abilitata la ridistribuzione proattiva delle istanze e se il gruppo di istanze gestite ha una distribuzione non uniforme delle istanze tra le zone, il gruppo elimina o crea in modo proattivo le istanze nelle zone per ristabilire una distribuzione uniforme.
  • Il campo autoscalers.status riporta un avviso: "La scalabilità automatica opera in una modalità limitata: OFF".

Controllare la frequenza di scale in di un gestore della scalabilità automatica

Se sono necessari molti minuti per l'inizializzazione dei tuoi workload, configura i controlli di scale in per ridurre il rischio di latenza di risposta e interruzioni a causa di eventi di scale in improvvisi. Nello specifico, se prevedi regolarmente un picco di carico subito dopo un calo del carico, puoi limitare la frequenza di scalabilità. Il limite della frequenza di scale-in impedisce al gestore della scalabilità automatica di ridurre le dimensioni di un MIG di più istanze VM di quanto il tuo carico di lavoro possa tollerare di perdere.

Configurazione dei controlli di scale in

La configurazione dei controlli di scale in è facoltativa. Per impostazione predefinita, i controlli di scalabilità non sono configurati. Se non è configurato, lo strumento di scalabilità automatica si basa comunque sul suo meccanismo di stabilizzazione predefinito. In altre parole, mantiene le dimensioni consigliate a un livello necessario per gestire il picco di caricamento osservato durante il periodo di stabilizzazione.

Console

Per configurare i controlli di riduzione della scala per un gruppo di istanze gestite con scalabilità automatica:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite con scalabilità automatica nell'elenco per aprire la pagina di panoramica del gruppo.

  3. Fai clic su Modifica per visualizzare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, fai clic su Controlli di scale in, quindi seleziona Abilita controlli di scale in.

  5. In Non eseguire la scalabilità in meno di, specifica il numero massimo o la percentuale di istanze che possono essere rimosse dal gruppo alla volta.

  6. In Nel corso di, specifica la frequenza con cui le istanze possono essere rimosse dal gruppo.

  7. Fai clic su Salva.

gcloud

Puoi configurare i controlli di riduzione della scalabilità quando crei un'autoscalabilità o quando la aggiorni.

Configurare i controlli di riduzione della scalabilità durante la creazione di un gestore della scalabilità automatica

Imposta i controlli di riduzione della scalabilità quando crei un gestore della scalabilità automatica per un gruppo di istanze gestite utilizzando il flag --scale-in-control con il comando gcloud compute instance-groups managed set-autoscaling. Ad esempio, utilizza il seguente comando per configurare la scalabilità automatica per un example-group:

gcloud compute instance-groups managed set-autoscaling INSTANCE_GROUP_NAME \
    --target-cpu-utilization 0.6 \
    --max-num-replicas 50 \
    --scale-in-control max-scaled-in-replicas=MAX_SCALE_IN_REPLICAS,time-window=TIME_WINDOW

Configurare i controlli di riduzione della scalabilità durante l'aggiornamento di un gestore della scalabilità automatica

Aggiorna i controlli di riduzione nel gestore della scalabilità automatica esistente di un MIG utilizzando il flag --scale-in-control con il comando gcloud compute instance-groups managed update-autoscaling. Ad esempio, utilizza il seguente comando per impostare i controlli di riduzione in una configurazione di scalabilità automatica esistente per example-group:

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
    --scale-in-control max-scaled-in-replicas=MAX_SCALE_IN_REPLICAS,time-window=TIME_WINDOW

Sostituisci quanto segue:

  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite da actualizare.
  • MAX_SCALE_IN_REPLICAS: il numero massimo di VM che è consentito detrarre dalla dimensione del picco, preso dalla finestra temporale finale specificata. Il numero specificato di istanze VM puoi essere scalato contemporaneamente, quindi il tuo servizio dovrebbe essere in grado di permettersi di perdere così tante VM contemporaneamente. Puoi specificare un numero di VM o una percentuale. Utilizza il segno % per le percentuali, ad esempio: 50%.
  • TIME_WINDOW: finestra temporale finale da cui ricavare la dimensione di picco. La scalabilità automatica non ridurrà il numero di repliche oltre il numero massimo consentito dalle dimensioni di picco rilevate durante questo intervallo di tempo finale. Specifica questo valore in secondi in un intervallo [60, 3600].

Ad esempio, supponiamo che tu abbia impostato l'intervallo di tempo su 1800 secondi (30 minuti). Per calcolare le dimensioni consigliate correnti per il gruppo di istanze gestite, il gestore della scalabilità automatica utilizza la seguente logica:

  • Prendi le dimensioni di picco degli ultimi 30 minuti (ad esempio 100 VM)
  • Prendi max-scaled-in-replicas (ad esempio 10 VM)
  • Imposta il limite inferiore delle dimensioni consigliate su: dimensioni di picco meno max-scaled-in-replicas (100 - 10 = 90 VM)

REST

Configura i controlli di riduzione impostando i campi maxScaledInReplicas e timeWindowSec all'interno della struttura autoscalingPolicy.scaleInControl in una risorsa di scalabilità automatica a livello di zona o a livello di regione. Non sono previsti valori predefiniti per questi campi, devi fornire valori per entrambi i campi.

Puoi configurare i controlli di riduzione della scalabilità quando crei un'autoscalabilità o quando la aggiorni.

Configurare i controlli di riduzione della scalabilità durante la creazione di un gestore della scalabilità automatica

Per un gruppo di istanze gestite a livello di zona, utilizza il metodo autoscalers.insert. Per un gruppo di istanze gestite a livello di regione, utilizza il metodo regionAutoscalers.insert.

POST
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/autoscalers

{
  "name": "AUTOSCALER_NAME",
  "target": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/INSTANCE_GROUP_NAME",
  "autoscalingPolicy": {
    "minNumReplicas": 1,
    "maxNumReplicas": 5,
    "coolDownPeriodSec": 60,
    "cpuUtilization": {
      "utilizationTarget": 0.8
    },
    "scaleInControl": {
      "maxScaledInReplicas": {
           "fixed": MAX_SCALE_IN_REPLICAS
      },
      "timeWindowSec": TIME_WINDOW
    }
  }
}

Per ulteriori informazioni sulla creazione di un gestore della scalabilità automatica, consulta i seguenti articoli:

Configurare i controlli di riduzione della scalabilità durante l'aggiornamento di un gestore della scalabilità automatica

Per un gruppo di istanze gestite a livello di zona, utilizza il metodo autoscalers.patch. Per un gruppo di istanze gestite a livello di regione, utilizza il metodo regionAutoscalers.patch.

PATCH
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/autoscalers?autoscaler=AUTOSCALER_NAME

{
  "autoscalingPolicy": {
    "minNumReplicas": 1,
    "maxNumReplicas": 5,
    "coolDownPeriodSec": 60,
    "cpuUtilization": {
      "utilizationTarget": 0.8
    },
    "scaleInControl": {
      "maxScaledInReplicas": {
           "fixed": MAX_SCALE_IN_REPLICAS
      },
      "timeWindowSec": TIME_WINDOW
    }
  }
}

Sostituisci quanto segue:

  • AUTOSCALER_NAME: il nome del gestore della scalabilità automatica da creare. Puoi assegnare un nome all'autoscalatore in base al MIG che lo utilizzerà o scegliere un altro nome.
  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite a cui aggiungere il gestore della scalabilità automatica. Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE con regions/REGION.
  • MAX_SCALE_IN_REPLICAS: il numero massimo di VM che è consentito detrarre dalla dimensione target consigliata per il picco, ricavata dall'intervallo di tempo finale specificato. Il numero specificato di istanze VM può essere scalato contemporaneamente, quindi il tuo servizio dovrebbe essere in grado di permettersi di perdere contemporaneamente questo numero di VM. Puoi specificare un numero di VM o una percentuale. Utilizza maxScaledInReplicas.percentage per specificare un valore percentuale.
  • TIME_WINDOW: la finestra temporale finale da cui ricavare la dimensione massima consigliata. La scalabilità automatica non ridurrà il numero di repliche oltre il numero massimo consentito rispetto alle dimensioni consigliate per il picco rilevate durante questo intervallo di tempo finale. Specifica questo valore in secondi in un intervallo [60, 3600]; ad esempio: 1800.

Ad esempio, supponiamo che tu abbia impostato l'intervallo di tempo su 1800 secondi (30 minuti). Per calcolare le dimensioni consigliate correnti per il gruppo di istanze gestite, il gestore della scalabilità automatica utilizza la seguente logica:

  • Prendi le dimensioni di picco degli ultimi 30 minuti (ad esempio 100 VM)
  • Prendi max-scaled-in-replicas (ad esempio 10 VM)
  • Imposta il limite inferiore delle dimensioni consigliate su: dimensioni di picco meno max-scaled-in-replicas (100 - 10 = 90 VM)

Per ulteriori informazioni sul funzionamento dei controlli di scale in, consulta Informazioni sulle decisioni del gestore della scalabilità automatica.

Ottenere la configurazione attuale dei controlli di scale in

Per ottenere la configurazione attuale dei controlli di riduzione, consulta Ottenere informazioni su un gestore della scalabilità automatica.

Rimuovere i controlli di scale in

Puoi rimuovere i controlli di scalabilità in per rimuovere le limitazioni relative ai tempi e alle dimensioni delle operazioni di scalabilità utilizzando Google Cloud CLI o l'API Compute Engine.

Senza i controlli di riduzione, lo strumento di scalabilità automatica si basa ancora sul suo meccanismo di stabilizzazione predefinito. Nello specifico, mantiene una dimensione consigliata a un livello necessario per gestire il carico di picco, osservato durante il periodo di stabilizzazione.

Console

Per rimuovere i controlli di scale in per un gruppo di istanze gestite con scalabilità automatica:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite con scalabilità automatica nell'elenco per aprire la pagina di panoramica del gruppo.

  3. Fai clic su Modifica per visualizzare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, fai clic su Controlli di scale in, quindi deseleziona la casella di controllo Abilita controlli di scale in.

  5. Fai clic su Salva.

gcloud

Rimuovi i controlli di scalabilità interna utilizzando il flag --clear-scale-in-control con il comando gcloud compute instance-groups managed update-autoscaling. Ad esempio, utilizza il seguente comando per rimuovere i controlli di riduzione della scalabilità dalla configurazione della scalabilità automatica per example-group:

gcloud compute instance-groups managed update-autoscaling example-group \
    --clear-scale-in-control

REST

Per rimuovere i controlli di riduzione, utilizza il metodo autoscalers.patch per un gruppo di istanze gestite zonale o il metodo regionAutoscalers.patch per un gruppo di istanze gestite regionale e fornisci una configurazione vuota per i controlli di riduzione.

PATCH
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers?autoscaler=AUTOSCALER_NAME

{
  "autoscalingPolicy": {
    "scaleInControl": null
  }
}

Sostituisci quanto segue:

  • AUTOSCALER_NAME: il nome del gestore della scalabilità automatica da actualizare. Per ottenere un elenco dei gestori della scalabilità automatica esistenti e dei relativi MIG di destinazione, utilizza il metodo autoscalers.aggregatedList.

Eliminazione di un gestore della scalabilità automatica

Puoi eliminare definitivamente la risorsa di adeguamento automatico e la relativa cronologia. Se vuoi interrompere temporaneamente la scalabilità automatica e mantenere la risorsa del gestore della scalabilità automatica, nonché la relativa configurazione e cronologia, disattiva il gestore della scalabilità automatica.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo MIG nell'elenco per aprire la pagina di panoramica del gruppo.

  3. Fai clic su Modifica per visualizzare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, dall'elenco a discesa Modalità di scalabilità automatica, seleziona Elimina configurazione della scalabilità automatica per arrestare lo scalatore automatico ed eliminare la relativa configurazione.

  5. Al termine, fai clic su Salva.

gcloud

Utilizza il comando stop-autoscaling per interrompere un gestore della scalabilità automatica ed eliminarne la configurazione.

gcloud compute instance-groups managed stop-autoscaling INSTANCE_GROUP_NAME

L'interruzione di un gestore della scalabilità automatica ne comporta l'eliminazione dal gruppo di istanze gestite. Se vuoi riavviare il gestore della scalabilità automatica, devi ricrearlo utilizzando il comando set-autoscaling.

Se elimini un gruppo di istanze gestite utilizzando la gcloud CLI, vengono eliminati anche eventuali gestori della scalabilità automatica associati al gruppo di istanze gestite.

REST

Per arrestare un regolatore della scalabilità ed eliminare la relativa configurazione, utilizza il metodo autoscalers.delete per un gruppo di istanze gestite zonale o il metodo regionAutoscalers.delete per un gruppo di istanze gestite a livello di area geografica.

 DELETE https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/AUTOSCALER_NAME

Feedback

Vogliamo conoscere i tuoi casi d'uso, le tue sfide e i tuoi feedback sull'autoscaling. Condividi il tuo feedback con il nostro team all'indirizzo mig-discuss@google.com.

Passaggi successivi