Utilizzo dei gestori della scalabilità automatica


Se utilizzi gruppi di istanze gestite, leggi questo documento per scoprire come creare, configurare ed eliminare il ridimensionamento automatico del gruppo di istanze gestite.

Prima di iniziare

  • Se non l'hai già fatto, configura l'autenticazione. Autenticazione è Il processo di verifica dell'identità per l'accesso ai servizi e alle API di Google Cloud. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine come segue.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Install the Google Cloud CLI, then initialize it by running the following command:

      gcloud init
    2. Set a default region and zone.
    3. REST

      Per utilizzare gli esempi dell'API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali fornite a gcloud CLI.

        Install the Google Cloud CLI, then initialize it by running the following command:

        gcloud init

      Per ulteriori informazioni, vedi Esegui l'autenticazione per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud.

Creazione di un gestore della scalabilità automatica

La creazione di un gestore della scalabilità automatica è leggermente diversa a seconda del criterio di scalabilità automatica che vuoi utilizzare. Per istruzioni sulla creazione di un gestore della scalabilità automatica, consulta:

Ottenere informazioni su un gestore della scalabilità automatica

Per ottenere maggiori informazioni su un particolare gestore della scalabilità automatica, utilizza la console, gcloud compute instance-groups managed describe o il metodo get per un a livello di zona o regionale Risorsa REST del gestore della scalabilità automatica.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina Panoramica del gruppo.
  3. Fai clic su Dettagli per visualizzare i dettagli del gruppo, inclusa la scalabilità automatica impostazioni.

gcloud

Usa il comando instance-groups managed describe:

gcloud compute instance-groups managed describe INSTANCE_GROUP_NAME

Se al gruppo è associato un gestore della scalabilità automatica, il comando restituisce i dettagli il gestore della scalabilità automatica:

...
autoscaler:
  autoscalingPolicy:
    coolDownPeriodSec: 60
    cpuUtilization:
      utilizationTarget: 0.6
    maxNumReplicas: 20
    minNumReplicas: 10
    mode: ON
    scaleInControl:
      timeWindowSec: 300
      maxScaledInReplicas:
        fixed: 3
        calculated: 3
...

REST

Utilizza il metodo instanceGroupManagers.get. Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE con regions/REGION.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME

Se al gruppo è associato un gestore della scalabilità automatica, la richiesta restituisce un link alla risorsa del gestore della scalabilità automatica.

200 OK

{
  ...
  "status": {
    ...
    "autoscaler": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/autoscalers/example-group"
  },
}

Per recuperare i dettagli della risorsa del gestore della scalabilità automatica, utilizza il Metodo autoscalers.get per un gruppo di istanze gestite a livello di zona Metodo regionAutoscalers.get per un gruppo di istanze gestite a livello di regione.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/example-autoscaler
200 OK

{
 "kind": "compute#autoscaler",
 "id": "8744945839459481093",
 "creationTimestamp": "2018-09-28T13:02:50.553-07:00",
 "name": "example-group",
 "target": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/instanceGroupManagers/example-group",
 "autoscalingPolicy": {
  "minNumReplicas": 10,
  "maxNumReplicas": 20,
  "mode": "ON",
  "scaleInControl": {
    "timeWindowSec": 60,
    "maxScaledInReplicas": {
      "calculated": 3,
      "percent": 15
    }
  },
  "coolDownPeriodSec": 60,
  "cpuUtilization": {
   "utilizationTarget": 0.6
  }
 },
 "zone": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c",
 "selfLink": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/autoscalers/example-group",
 "status": "ACTIVE"
}

Aggiornamento di un gestore della scalabilità automatica

Quando aggiorni un gestore della scalabilità automatica, potrebbe essere necessario un po' di tempo prima che le modifiche ma potrebbero trascorrere un paio di minuti prima che il nuovo gestore della scalabilità automatica vengono applicate le impostazioni di fabbrica.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina Panoramica del gruppo.
  3. Fai clic su Modifica per visualizzare e aggiornare la configurazione corrente del gruppo, incluse le impostazioni di scalabilità automatica.
  4. Al termine, fai clic su Salva.

gcloud

Utilizza la Comando update-autoscaling.

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
        --max-num-replicas MAX_NUM ...

Per istruzioni su come creare un gestore della scalabilità automatica, consulta Creazione di un gestore della scalabilità automatica.

REST

Per aggiornare una risorsa di gestione della scalabilità automatica, utilizza il metodo autoscalers.patch per un gruppo di istanze gestite a livello di zona o il metodo regionAutoscalers.patch per un gruppo di istanze gestite a livello di regione. Fornisci un corpo della richiesta che contenga la nuova configurazione.

PATCH https://compute.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f/autoscalers/example-autoscaler

{
 "autoscalingPolicy": {
  "maxNumReplicas": 20
 }
}
200 OK

{
 "kind": "compute#operation",
 "id": "4244494732310423322",
 "name": "operation-1556912627871-58800f8216ed7-74ab1720-7d360603",
 "zone": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f",
 "operationType": "compute.autoscalers.patch",
 "targetLink": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f/autoscalers/example-autoscaler",
 "targetId": "340775527929467142",
 "status": "RUNNING",
 ...
}

Quando esegui richieste che modificano i dati, zoneOperations o Risorsa regionOperations ed eseguire una query sull'operazione per verificare lo stato del modifica.

Utilizzo della scalabilità automatica predittiva

La scalabilità automatica predittiva utilizza i dati storici per eseguire lo scale out del gruppo in anticipo rispetto al carico previsto. È la scelta migliore se il carico di lavoro soddisfa i seguenti requisiti criteri:

  • L'inizializzazione dell'applicazione richiede molto tempo, ad esempio se configuri un periodo di inizializzazione di più di 2 minuti.
  • Il carico di lavoro varia in modo prevedibile a seconda dei cicli giornalieri o settimanali.

Per ulteriori informazioni, vedi Scalabilità basata sulle previsioni.

Disattivare o limitare un gestore della scalabilità automatica

Disattiva un gestore della scalabilità automatica per impedirgli temporaneamente di scalare il gruppo di istanze gestite oppure limita il gestore della scalabilità automatica in modo che possa fare lo scale out solo del gruppo di istanze gestite. Questa funzionalità è utile quando vuoi:

  • Analizza le istanze VM senza interferenze di scale in.
  • Riconfigura più proprietà del tuo gruppo di istanze gestite senza azioni di scalabilità attivate quando il gruppo è solo parzialmente riconfigurate.
  • Mantieni la capacità del gruppo di istanze gestite per un rollback rapido durante il reindirizzamento di un a un nuovo gruppo di istanze gestite.
  • Abilita la scalabilità automatica predittiva in un secondo momento. La scalabilità automatica predittiva richiede un criterio di scalabilità automatica per iniziare a raccogliere la cronologia del carico su cui basare le previsioni. Il gestore della scalabilità automatica rileva questa cronologia anche quando la modalità è impostata su OFF.

Se e quando riattivi il gestore della scalabilità automatica, quest'ultimo restituisce automaticamente al normale funzionamento.

Segui le istruzioni fornite in questa sezione per impostare solo quella del gestore della scalabilità automatica. Sono disponibili le seguenti modalità:

  • Off: disattiva temporaneamente la scalabilità automatica. Usa questa modalità per evitare modifiche automatiche delle dimensioni del gruppo di istanze gestite. La configurazione della scalabilità automatica rimangono intatti per riabilitare la scalabilità automatica in un secondo momento.
  • Solo scale out: limita la scalabilità automatica solo all'aggiunta di nuove istanze VM. Utilizza le funzionalità di questa modalità per proteggere il gruppo dal restringimento e consentirgli di eseguire il provisioning di VM aggiuntive quando il carico aumenta.
  • On: abilita tutte le operazioni di scalabilità automatica in base al criterio.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina Panoramica del gruppo.
  3. Fai clic su Modifica per visualizzare la configurazione attuale del gruppo, incluse: e le impostazioni di scalabilità automatica.
  4. In Scalabilità automatica, imposta la modalità di scalabilità automatica in modo da disattivare o limitare la scalabilità automatica per il gruppo o riattivare il gestore della scalabilità automatica.
  5. Al termine, fai clic su Salva.

gcloud

Per disattivare, limitare o riattivare un gestore della scalabilità automatica, utilizza il Comando update-autoscaling con il flag --mode.

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
        --mode MODE 

Sostituisci quanto segue:

  • MODE:
    • off per disattivare il gestore della scalabilità automatica, ma mantenere la sua configurazione
    • only-scale-out per limitare il gestore della scalabilità automatica all'aggiunta solo di istanze VM
    • on per riattivare tutte le attività del gestore della scalabilità automatica in base alle proprie norme

REST

Per aggiornare la modalità di una risorsa del gestore della scalabilità automatica, utilizza Metodo autoscalers.patch per un gruppo di istanze gestite a livello di zona o per il metodo regionAutoscalers.patch per un gruppo di istanze gestite a livello di regione. Fornisci un corpo della richiesta che includa la proprietà autoscalingPolicy.mode.

PATCH https://compute.googleapis.com/compute/v1/projects/my-project/regions/us-central1-f/autoscalers?autoscaler=my-autoscaler

{
  "autoscalingPolicy": {
    "mode":"MODE"
  }
}

Sostituisci quanto segue:

  • MODE:
    • OFF per disattivare il gestore della scalabilità automatica, ma mantenere la sua configurazione
    • ONLY_SCALE_OUT per limitare il gestore della scalabilità automatica all'aggiunta solo di istanze
    • ON per riattivare tutte le attività del gestore della scalabilità automatica in base alle proprie norme

Quando imposti la modalità di scalabilità automatica su ONLY_SCALE_OUT, il gestore della scalabilità automatica si comporta come che segue:

  • Il gestore della scalabilità automatica non riduce il valore targetSize del gruppo di istanze gestite indipendentemente dal fatto che diminuzioni del carico o modifiche alla configurazione del gestore della scalabilità automatica.
  • Se modifichi manualmente le dimensioni target di un gruppo di istanze gestite con scalabilità automatica zonale, il gestore della scalabilità automatica override le dimensioni fornite manualmente se sono inferiori a quelle consigliate dal gestore della scalabilità automatica.
  • Non puoi modificare manualmente la dimensione target di un gruppo di istanze gestite a livello di regione.
  • Se imposti il campo autoscalingPolicy.maxNumReplicas su un valore inferiore al valore targetSize corrente del gruppo mentre la modalità del gestore della scalabilità automatica è impostata su ONLY_SCALE_OUT, il gestore della scalabilità automatica non riduce il numero di istanze nel gruppo. Come di consueto, il gestore della scalabilità automatica ricalcola continuamente dimensione consigliata e potrebbe ridurne quella consigliata per il gruppo con il nuovo valore massimo, ma non è stato fatto lo scale in del gruppo.
  • Il campo autoscalers.status segnala l'avviso: "La scalabilità automatica funziona in modalità con restrizioni: ONLY_SCALE_OUT."

Quando imposti la modalità del gestore della scalabilità automatica su OFF, il gestore della scalabilità automatica si comporta come segue:

  • Il gestore della scalabilità automatica non modifica il valore targetSize del gruppo di istanze gestite in risposta a modifiche al carico o alla configurazione del gestore della scalabilità automatica. Come di consueto, il gestore della scalabilità automatica calcola nuovamente continuamente le dimensioni consigliate del gruppo e potrebbe ridurle per rispettare il nuovo valore massimo, ma il gruppo non viene ridotto.
  • Puoi modificare manualmente le dimensioni di destinazione di un gruppo di istanze gestite a livello di zona o di regione. La I valori minNumReplicas e maxNumReplicas del criterio di scalabilità automatica non influisce sulle dimensioni impostate.
  • Se disattivi la scalabilità automatica per un gruppo di istanze gestite a livello di regione in cui ridistribuzione proattiva delle istanze e se il gruppo di istanze gestite ha una distribuzione non uniforme delle istanze tra zone, il gruppo elimina o crea in modo proattivo le istanze nelle rispettive zone per e ristabilire una distribuzione uniforme.
  • Il campo autoscalers.status segnala l'avviso: "La scalabilità automatica funziona in modalità con restrizioni: OFF."

Controllare la frequenza di riduzione di un gestore della scalabilità automatica

Se sono necessari molti minuti per l'inizializzazione dei tuoi carichi di lavoro, configura i controlli di scale in per ridurre il rischio di latenza di risposta e interruzioni a causa di eventi di scale in improvvisi. Nello specifico, se prevedi che si verificherà sistematicamente un picco di carico subito dopo una diminuzione del carico, puoi limitare la percentuale di scale in. Limitazione della percentuale di scale in impedisce al gestore della scalabilità automatica di ridurre le dimensioni di un gruppo di istanze gestite di un numero maggiore di istanze VM che il carico di lavoro può tollerare.

Configurazione dei controlli di scale in

La configurazione dei controlli di scale in è facoltativa. Per impostazione predefinita, i controlli di scale in configurato. Se non viene configurato, il gestore della scalabilità automatica continua a fare affidamento sul valore predefinito meccanismo di stabilizzazione. In altre parole, mantiene le dimensioni consigliate a un livello necessario per gestire il picco di caricamento osservato durante il periodo di stabilizzazione.

Console

Per configurare i controlli di riduzione della scala per un gruppo di istanze gestite con scalabilità automatica:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite con scalabilità automatica dall'elenco per aprire il pagina Panoramica.

  3. Fai clic su Modifica per visualizzare la configurazione attuale del gruppo, incluse: e le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, fai clic su Controlli di scale in. quindi seleziona Abilita controlli di scale in.

  5. In Non scalare in più di, specifica il numero massimo o percentuale di istanze che è possibile rimuovere dal gruppo contemporaneamente.

  6. In Nel corso di, specifica la frequenza con cui le istanze possono essere rimosso dal gruppo.

  7. Fai clic su Salva.

gcloud

Puoi configurare i controlli di scale in quando crei un gestore della scalabilità automatica o quando aggiornare un gestore della scalabilità automatica.

Configurare i controlli di scale in durante la creazione di un gestore della scalabilità automatica

Imposta i controlli di riduzione della scalabilità quando crei un gestore della scalabilità automatica per un gruppo di istanze gestite utilizzando il flag --scale-in-control con il comando gcloud compute instance-groups managed set-autoscaling. Ad esempio, utilizza il comando seguente per configurare la scalabilità automatica example-group:

gcloud compute instance-groups managed set-autoscaling INSTANCE_GROUP_NAME \
    --target-cpu-utilization 0.6 \
    --max-num-replicas 50 \
    --scale-in-control max-scaled-in-replicas=MAX_SCALE_IN_REPLICAS,time-window=TIME_WINDOW

Configurare i controlli di riduzione della scalabilità durante l'aggiornamento di un gestore della scalabilità automatica

Aggiorna i controlli di scale in nel gestore della scalabilità automatica esistente di un gruppo di istanze gestite utilizzando il flag --scale-in-control con gcloud compute instance-groups managed update-autoscaling comando. Ad esempio, utilizza il comando seguente per impostare i controlli di scale in in una configurazione della scalabilità automatica esistente per example-group:

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
    --scale-in-control max-scaled-in-replicas=MAX_SCALE_IN_REPLICAS,time-window=TIME_WINDOW

Sostituisci quanto segue:

  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite da aggiornamento.
  • MAX_SCALE_IN_REPLICAS: il numero massimo di VM che è consentito detrarre dalla dimensione di picco, ricavata da l'intervallo di tempo finale specificato. Il numero specificato di istanze VM possono essere scalati in una sola volta, per cui il tuo servizio tutte queste VM contemporaneamente. Puoi specificare un numero di VM o una percentuale. Utilizza il segno % per le percentuali, ad esempio: 50%.
  • TIME_WINDOW: intervallo di tempo finale per acquisire dimensione massima. La scalabilità automatica non fa fare lo scale in di più di il numero massimo consentito di repliche dalla dimensione massima in questa finestra temporale finale. Specifica questo valore in secondi entro un intervallo di [60, 3600].

Ad esempio, supponiamo che tu abbia impostato la finestra temporale su 1800 secondi (30 minuti). Durante il calcolo delle dimensioni attuali consigliate per il gruppo di istanze gestite, il gestore della scalabilità automatica utilizza la seguente logica:

  • Prendi le dimensioni di picco degli ultimi 30 minuti (ad esempio 100 VM)
  • Prendi max-scaled-in-replicas (ad esempio, 10 VM)
  • Imposta il limite inferiore della dimensione consigliata su: dimensione picco meno max-scaled-in-replicas (100-10 = 90 VM)

REST

Configura i controlli di scale in impostando maxScaledInReplicas e timeWindowSec all'interno di autoscalingPolicy.scaleInControl in una zona regionale del gestore della scalabilità automatica. Non esistono valori predefiniti per questi campi, devi e fornire valori per entrambi i campi.

Puoi configurare i controlli di scale in quando crei un gestore della scalabilità automatica o quando aggiornare un gestore della scalabilità automatica.

Configurare i controlli di scale in durante la creazione di un gestore della scalabilità automatica

Per un gruppo di istanze gestite a livello di zona, utilizza il metodo autoscalers.insert. Per un gruppo di istanze gestite a livello di regione, utilizza il metodo regionAutoscalers.insert.

POST
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/autoscalers

{
  "name": "AUTOSCALER_NAME",
  "target": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/INSTANCE_GROUP_NAME",
  "autoscalingPolicy": {
    "minNumReplicas": 1,
    "maxNumReplicas": 5,
    "coolDownPeriodSec": 60,
    "cpuUtilization": {
      "utilizationTarget": 0.8
    },
    "scaleInControl": {
      "maxScaledInReplicas": {
           "fixed": MAX_SCALE_IN_REPLICAS
      },
      "timeWindowSec": TIME_WINDOW
    }
  }
}

Per saperne di più sulla creazione di un gestore della scalabilità automatica, consulta quanto segue articoli:

Configurare i controlli di scale in durante l'aggiornamento di un gestore della scalabilità automatica

Per un gruppo di istanze gestite a livello di zona, utilizza il metodo autoscalers.patch. Per un gruppo di istanze gestite a livello di regione, utilizza il metodo regionAutoscalers.patch.

PATCH
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/autoscalers?autoscaler=AUTOSCALER_NAME

{
  "autoscalingPolicy": {
    "minNumReplicas": 1,
    "maxNumReplicas": 5,
    "coolDownPeriodSec": 60,
    "cpuUtilization": {
      "utilizationTarget": 0.8
    },
    "scaleInControl": {
      "maxScaledInReplicas": {
           "fixed": MAX_SCALE_IN_REPLICAS
      },
      "timeWindowSec": TIME_WINDOW
    }
  }
}

Sostituisci quanto segue:

  • AUTOSCALER_NAME: il nome del gestore della scalabilità automatica per creare. Puoi assegnare un nome al gestore della scalabilità automatica in base al gruppo di istanze gestite che lo utilizzerà, oppure assegnagli un altro nome.
  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite da aggiungere il gestore della scalabilità automatica. Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE con regions/REGION.
  • MAX_SCALE_IN_REPLICAS: il numero massimo di VM che è possibile detrarre dalla dimensione target consigliata di picco, presa dalla finestra di tempo finale specificata. Il numero di VM specificato le istanze possono essere scalate in tutte le istanze contemporaneamente, per cui il servizio dovrebbe essere in grado di perdere tutte queste VM in una volta sola. Puoi specificare un di VM o una percentuale. Usa maxScaledInReplicas.percentage per specificare un valore percentuale.
  • TIME_WINDOW: la finestra di tempo finale da completare la dimensione massima consigliata. La scalabilità automatica non fa fare lo scale in di più di il numero massimo consentito di repliche dalla dimensione massima consigliata in questa finestra temporale finale. Specifica questo valore in secondi entro un intervallo di [60, 3600]; ad esempio: 1800.

Ad esempio, supponiamo che tu abbia impostato la finestra temporale su 1800 secondi (30 minuti). Durante il calcolo delle dimensioni attuali consigliate per il gruppo di istanze gestite, il gestore della scalabilità automatica utilizza la seguente logica:

  • Prendi le dimensioni di picco degli ultimi 30 minuti (ad esempio 100 VM)
  • Prendi max-scaled-in-replicas (ad esempio, 10 VM)
  • Imposta il limite inferiore della dimensione consigliata su: dimensione picco meno max-scaled-in-replicas (100-10 = 90 VM)

Per saperne di più su come funzionano i controlli di scale in, consulta Informazioni sulle decisioni del gestore della scalabilità automatica.

Recupero della configurazione attuale dei controlli di scale in

Per ottenere la configurazione attuale dei controlli di scale in, consulta Ottenere informazioni su un gestore della scalabilità automatica.

Rimozione dei controlli di scale in

Puoi rimuovere i controlli di scale in per eliminare le limitazioni relative a tempistiche e delle operazioni di scale in utilizzando Google Cloud CLI o l'API Compute Engine.

Senza controlli di scale in, il gestore della scalabilità automatica continua a fare affidamento sulle sue meccanismo di stabilizzazione. Nello specifico, mantiene la dimensione consigliata a un prezzo necessario per gestire il carico di picco, osservato durante periodo di stabilizzazione.

Console

Per rimuovere i controlli di scale in per un gruppo di istanze gestite con scalabilità automatica:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite con scalabilità automatica dall'elenco per aprire il pagina Panoramica.

  3. Fai clic su Modifica per visualizzare la configurazione attuale del gruppo, incluse: e le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, fai clic su Controlli di scale in, quindi Deseleziona la casella di controllo Abilita controlli di scale in.

  5. Fai clic su Salva.

gcloud

Rimuovi i controlli di scale in utilizzando il flag --clear-scale-in-control con il gcloud compute instance-groups managed update-autoscaling comando. Ad esempio, utilizza il comando seguente per rimuovere i controlli di scale in la configurazione della scalabilità automatica per example-group:

gcloud compute instance-groups managed update-autoscaling example-group \
    --clear-scale-in-control

REST

Per rimuovere i controlli di scale in, utilizza la autoscalers.patch per un gruppo di istanze gestite a livello di zona oppure utilizza il metodo Metodo regionAutoscalers.patch per un gruppo di istanze gestite a livello di regione, e fornire una configurazione vuota per i controlli di scale in.

PATCH
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers?autoscaler=AUTOSCALER_NAME

{
  "autoscalingPolicy": {
    "scaleInControl": null
  }
}

Sostituisci quanto segue:

  • AUTOSCALER_NAME: il nome del gestore della scalabilità automatica per aggiornamento. Per ottenere un elenco dei gestori della scalabilità automatica esistenti e dei relativi MIG di destinazione, utilizza il metodo autoscalers.aggregatedList.

Eliminazione di un gestore della scalabilità automatica

Puoi eliminare definitivamente la risorsa del gestore della scalabilità automatica e la relativa cronologia. Se vuoi interrompere temporaneamente la scalabilità automatica e mantenere la risorsa del gestore della scalabilità automatica, nonché la relativa configurazione e cronologia, disattiva il gestore della scalabilità automatica.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina Panoramica del gruppo.

  3. Fai clic su Modifica per visualizzare la configurazione attuale del gruppo, incluse: e le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, dall'elenco a discesa Modalità di scalabilità automatica. Seleziona Elimina configurazione scalabilità automatica per arrestare il gestore della scalabilità automatica ed eliminarne la configurazione.

  5. Al termine, fai clic su Salva.

gcloud

Usa il comando stop-autoscaling per arrestare un gestore della scalabilità automatica ed eliminarne la configurazione.

gcloud compute instance-groups managed stop-autoscaling INSTANCE_GROUP_NAME

L'arresto di un gestore della scalabilità automatica lo elimina dal gruppo di istanze gestite. Se vuoi riavviare del gestore della scalabilità automatica, devi ricrearlo utilizzando Comando set-autoscaling.

Se elimini un gruppo di istanze gestite utilizzando gcloud CLI, Vengono eliminati anche i gestori della scalabilità automatica collegati al gruppo di istanze gestite.

REST

Per arrestare un gestore della scalabilità automatica ed eliminare la sua configurazione, utilizza Metodo autoscalers.delete per un gruppo di istanze gestite a livello di zona Metodo regionAutoscalers.delete per un gruppo di istanze gestite a livello di regione.

 DELETE https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/AUTOSCALER_NAME

Feedback

Vogliamo conoscere i tuoi casi d'uso, le tue sfide e i tuoi feedback sull'autoscaling. Condividi il tuo feedback con il nostro team all'indirizzo mig-discuss@google.com.

Passaggi successivi