Utilizzo dei gestori della scalabilità automatica

Se utilizzi gruppi di istanze gestite, leggi questo documento per scoprire come creare, configurare ed eliminare il gestore della scalabilità automatica del tuo gruppo di istanze gestite.

Prima di iniziare

  • Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione è il processo mediante il quale viene verificata l'identità per l'accesso ai servizi e alle API Google Cloud. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti in Compute Engine nel seguente modo.

    Seleziona la scheda relativa a come intendi utilizzare gli esempi in questa pagina:

    Console

    Quando utilizzi la console Google Cloud per accedere ai servizi e alle API di Google Cloud, non devi configurare l'autenticazione.

    gcloud

    1. Installa Google Cloud CLI, quindi initialize eseguendo questo comando:

      gcloud init
    2. Imposta una regione e una zona predefinite.

    REST

    Per utilizzare gli esempi di API REST su questa pagina in un ambiente di sviluppo locale, devi utilizzare le credenziali che fornisci a gcloud CLI.

      Installa Google Cloud CLI, quindi initialize eseguendo questo comando:

      gcloud init

Creazione di un gestore della scalabilità automatica

La creazione di un gestore della scalabilità automatica è leggermente diversa a seconda del criterio di scalabilità automatica che vuoi utilizzare. Per istruzioni sulla creazione di un gestore della scalabilità automatica, consulta:

Ottenere informazioni su un gestore della scalabilità automatica

Per ottenere ulteriori informazioni su un determinato gestore della scalabilità automatica, utilizza la console, il sottocomando gcloud compute instance-groups managed describe o il metodo get per una risorsa REST del gestore della scalabilità automatica a livello di zona o regionale.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina di riepilogo del gruppo.
  3. Fai clic su Dettagli per visualizzare i dettagli del gruppo, incluse le impostazioni di scalabilità automatica.

gcloud

Utilizza il comando instance-groups managed describe:

gcloud compute instance-groups managed describe INSTANCE_GROUP_NAME

Se al gruppo è collegato un gestore della scalabilità automatica, il comando restituisce i dettagli sul gestore della scalabilità automatica:

...
autoscaler:
  autoscalingPolicy:
    coolDownPeriodSec: 60
    cpuUtilization:
      utilizationTarget: 0.6
    maxNumReplicas: 20
    minNumReplicas: 10
    mode: ON
    scaleInControl:
      timeWindowSec: 300
      maxScaledInReplicas:
        fixed: 3
        calculated: 3
...

REST

Utilizza il metodo instanceGroupManagers.get. Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE con regions/REGION.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME

Se al gruppo è collegato un gestore della scalabilità automatica, la richiesta restituisce un link alla risorsa del gestore della scalabilità automatica.

200 OK

{
  ...
  "status": {
    ...
    "autoscaler": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/autoscalers/example-group"
  },
}

Per recuperare i dettagli sulla risorsa del gestore della scalabilità automatica, utilizza il metodo autoscalers.get per un gruppo di istanze gestite a livello di zona o il metodo regionAutoscalers.get per un gruppo di istanze gestite a livello di regione.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/example-autoscaler
200 OK

{
 "kind": "compute#autoscaler",
 "id": "8744945839459481093",
 "creationTimestamp": "2018-09-28T13:02:50.553-07:00",
 "name": "example-group",
 "target": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/instanceGroupManagers/example-group",
 "autoscalingPolicy": {
  "minNumReplicas": 10,
  "maxNumReplicas": 20,
  "mode": "ON",
  "scaleInControl": {
    "timeWindowSec": 60,
    "maxScaledInReplicas": {
      "calculated": 3,
      "percent": 15
    }
  },
  "coolDownPeriodSec": 60,
  "cpuUtilization": {
   "utilizationTarget": 0.6
  }
 },
 "zone": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c",
 "selfLink": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-east1-c/autoscalers/example-group",
 "status": "ACTIVE"
}

Aggiornamento di un gestore della scalabilità automatica

Quando aggiorni un gestore della scalabilità automatica, potrebbe essere necessario un po' di tempo prima che le modifiche vengano propagate e potrebbero essere necessari alcuni minuti prima che le nuove impostazioni del gestore della scalabilità automatica vengano applicate.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina di riepilogo del gruppo.
  3. Fai clic su Modifica per visualizzare e aggiornare la configurazione attuale del gruppo, incluse le impostazioni di scalabilità automatica.
  4. Al termine, fai clic su Salva.

gcloud

Utilizza il comando update-autoscaling.

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
        --max-num-replicas MAX_NUM ...

Per istruzioni su come creare un gestore della scalabilità automatica, consulta Creazione di un gestore della scalabilità automatica.

REST

Per aggiornare una risorsa del gestore della scalabilità automatica, utilizza il metodo autoscalers.patch per un gruppo di istanze gestite a livello di zona o il metodo regionAutoscalers.patch per un gruppo di istanze gestite a livello di regione. Fornisci un corpo della richiesta contenente la nuova configurazione.

PATCH https://compute.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f/autoscalers/example-autoscaler

{
 "autoscalingPolicy": {
  "maxNumReplicas": 20
 }
}
200 OK

{
 "kind": "compute#operation",
 "id": "4244494732310423322",
 "name": "operation-1556912627871-58800f8216ed7-74ab1720-7d360603",
 "zone": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f",
 "operationType": "compute.autoscalers.patch",
 "targetLink": "https://www.googleapis.com/compute/v1/projects/my-project/zones/us-central1-f/autoscalers/example-autoscaler",
 "targetId": "340775527929467142",
 "status": "RUNNING",
 ...
}

Quando esegui richieste che modificano i dati, viene restituita una risorsa zoneOperations o regionOperations ed è possibile eseguire una query sull'operazione per verificare lo stato della modifica.

Utilizzo della scalabilità automatica predittiva

La scalabilità automatica predittiva utilizza dati storici per fare lo scale out del gruppo prima del carico previsto. Funziona al meglio se il carico di lavoro soddisfa i seguenti criteri:

  • L'inizializzazione dell'applicazione richiede molto tempo, ad esempio se configuri un periodo di inizializzazione superiore a due minuti.
  • Il carico di lavoro varia in modo prevedibile con cicli giornalieri o settimanali.

Per saperne di più, consulta Scalabilità basata sulle previsioni.

Disattivare o limitare un gestore della scalabilità automatica

Disattiva un gestore della scalabilità automatica per impedirgli temporaneamente la scalabilità del gruppo di istanze gestite oppure limita il gestore della scalabilità automatica in modo che possa fare lo scale out solo del gruppo di istanze gestite. Questa funzionalità è utile quando vuoi:

  • Esamina le istanze VM senza interferenze derivanti dallo scale in.
  • Riconfigura più proprietà del gruppo di istanze gestite senza che vengano attivate azioni di scalabilità mentre il gruppo viene riconfigurato solo parzialmente.
  • Mantieni la capacità dei gruppi di istanze gestite per un rollback veloce reindirizzando un carico di lavoro a un nuovo gruppo di istanze gestite.
  • Abilita la scalabilità automatica predittiva in un secondo momento. La scalabilità automatica predittiva richiede un criterio di scalabilità automatica per iniziare a raccogliere la cronologia del carico su cui basare le previsioni. Il gestore della scalabilità automatica rileva questa cronologia anche quando la sua modalità è impostata su OFF.

Se e quando riattivi il gestore della scalabilità automatica, questo torna automaticamente al funzionamento normale.

Segui le istruzioni fornite in questa sezione per impostare la modalità del gestore della scalabilità automatica. Sono disponibili le seguenti modalità:

  • Off: disabilita temporaneamente la scalabilità automatica. Usa questa modalità per impedire modifiche automatiche delle dimensioni del gruppo di istanze gestite. La configurazione della scalabilità automatica rimane invariata, quindi puoi riabilitarla in un secondo momento.
  • Solo scale out: limita la scalabilità automatica solo all'aggiunta di nuove istanze VM. Utilizza questa modalità per proteggere il gruppo dalla riduzione e consentire al gruppo di eseguire il provisioning di VM aggiuntive quando il carico aumenta.
  • On: abilita tutte le operazioni di scalabilità automatica in base al relativo criterio.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina di riepilogo del gruppo.
  3. Fai clic su Modifica per visualizzare la configurazione attuale del gruppo, incluse le impostazioni di scalabilità automatica.
  4. In Scalabilità automatica, imposta Modalità di scalabilità automatica per disabilitare o limitare la scalabilità automatica per il gruppo oppure per riattivare il gestore della scalabilità automatica.
  5. Al termine, fai clic su Salva.

gcloud

Per disabilitare, limitare o abilitare nuovamente un gestore della scalabilità automatica, utilizza il comando update-autoscaling con il flag --mode.

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
        --mode MODE 

Sostituisci quanto segue:

  • MODE:
    • off per disabilitare il gestore della scalabilità automatica, mantenendo però la sua configurazione
    • only-scale-out per limitare il gestore della scalabilità automatica solo all'aggiunta di istanze VM
    • on per riattivare tutte le attività del gestore della scalabilità automatica in base alle relative norme

REST

Per aggiornare la modalità di una risorsa del gestore della scalabilità automatica, utilizza il metodo autoscalers.patch per un gruppo di istanze gestite a livello di zona o il metodo regionAutoscalers.patch per un gruppo di istanze gestite a livello di regione. Fornisci un corpo della richiesta che includa la proprietà autoscalingPolicy.mode.

PATCH https://compute.googleapis.com/compute/v1/projects/my-project/regions/us-central1-f/autoscalers?autoscaler=my-autoscaler

{
  "autoscalingPolicy": {
    "mode":"MODE"
  }
}

Sostituisci quanto segue:

  • MODE:
    • OFF per disabilitare il gestore della scalabilità automatica, mantenendo però la sua configurazione
    • ONLY_SCALE_OUT per limitare il gestore della scalabilità automatica solo all'aggiunta di istanze
    • ON per riattivare tutte le attività del gestore della scalabilità automatica in base alle relative norme

Quando imposti la modalità di scalabilità automatica su ONLY_SCALE_OUT, il gestore della scalabilità automatica si comporta come segue:

  • Il gestore della scalabilità automatica non diminuisce il valore targetSize del gruppo di istanze gestite indipendentemente dalle diminuzioni del carico o dalle modifiche alla configurazione del gestore della scalabilità automatica.
  • Se modifichi manualmente la dimensione di destinazione di un gruppo di istanze gestite a livello di zona, il gestore della scalabilità automatica esegue l'override delle dimensioni fornite manualmente se sono inferiori a quelle consigliate dal gestore della scalabilità automatica.
  • Non puoi modificare manualmente la dimensione di destinazione di un gruppo di istanze gestite a livello di regione.
  • Se imposti il campo autoscalingPolicy.maxNumReplicas su un valore inferiore al valore corrente di targetSize del gruppo mentre la modalità del gestore della scalabilità automatica è impostata su ONLY_SCALE_OUT, il gestore della scalabilità automatica non riduce il numero di istanze nel gruppo. Come di consueto, il gestore della scalabilità automatica ricalcola continuamente la dimensione consigliata del gruppo e potrebbe ridurre quella consigliata per rispettare il nuovo limite massimo, ma il gruppo non viene adeguato.
  • Il campo autoscalers.status segnala l'avviso: "La scalabilità automatica funziona in una modalità con restrizioni: ONLY_SCALE_OUT."

Quando imposti la modalità del gestore della scalabilità automatica su OFF, il gestore della scalabilità automatica si comporta come segue:

  • Il gestore della scalabilità automatica non modifica il valore targetSize del gruppo di istanze gestite in risposta alle modifiche al carico o alla configurazione del gestore della scalabilità automatica. Come di consueto, il gestore della scalabilità automatica ricalcola continuamente la dimensione consigliata del gruppo e potrebbe ridurne la dimensione consigliata per rispettare il nuovo valore massimo, ma il gruppo non viene adeguato.
  • Puoi modificare manualmente la dimensione di destinazione di un gruppo di istanze gestite a livello di zona o di regione. I valori minNumReplicas e maxNumReplicas del criterio di scalabilità automatica non influiscono sulle dimensioni impostate.
  • Se disattivi la scalabilità automatica per un gruppo di istanze gestite a livello di regione in cui è abilitata la ridistribuzione proattiva delle istanze e se il gruppo di istanze gestite ha una distribuzione non uniforme delle istanze nelle zone, il gruppo elimina o crea in modo proattivo le istanze nelle proprie zone per ristabilire una distribuzione uniforme.
  • Il campo autoscalers.status segnala l'avviso: "La scalabilità automatica funziona in una modalità con restrizioni: OFF".

Controllare il tasso di scale in di un gestore della scalabilità automatica

Se l'inizializzazione dei tuoi carichi di lavoro richiede molti minuti, configura i controlli di scale in per ridurre il rischio di latenza di risposta e interruzioni a causa di eventi di scale in improvvisi. In particolare, se prevedi sistematicamente un picco del carico subito dopo un calo del carico, puoi limitare la percentuale di scale in. La limitazione della percentuale di scale in impedisce al gestore della scalabilità automatica di ridurre le dimensioni di un gruppo di istanze gestite di un numero di istanze VM superiore a quello tollerato dal tuo carico di lavoro.

Configurazione dei controlli di scale in

La configurazione dei controlli di scale in è facoltativa. Per impostazione predefinita, i controlli di scale in non sono configurati. Quando non è configurato, il gestore della scalabilità automatica si affida comunque al suo meccanismo di stabilizzazione predefinito. In altre parole, mantiene le dimensioni consigliate al livello necessario per gestire il carico di picco, osservato durante il periodo di stabilizzazione.

Console

Per configurare i controlli di scale in per un gruppo di istanze gestite con scalabilità automatica:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite con scalabilità automatica nell'elenco per aprire la pagina della panoramica del gruppo.

  3. Fai clic su Modifica per visualizzare la configurazione attuale del gruppo, incluse le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, fai clic su Controlli di scale in, poi seleziona Attiva controlli di scale in.

  5. In Non fare lo scale in di più di, specifica il numero massimo o la percentuale di istanze che possono essere rimosse dal gruppo contemporaneamente.

  6. In Nel corso del, specifica la frequenza con cui è possibile rimuovere le istanze dal gruppo.

  7. Fai clic su Salva.

gcloud

Puoi configurare i controlli di scale in quando crei un gestore della scalabilità automatica o quando aggiorni un gestore della scalabilità automatica.

Configurare i controlli di scale in durante la creazione di un gestore della scalabilità automatica

Imposta i controlli di scale in quando crei un gestore della scalabilità automatica per un gruppo di istanze gestite utilizzando il flag --scale-in-control con il comando gcloud compute instance-groups managed set-autoscaling. Ad esempio, utilizza il comando seguente per configurare la scalabilità automatica per un example-group:

gcloud compute instance-groups managed set-autoscaling INSTANCE_GROUP_NAME \
    --target-cpu-utilization 0.6 \
    --max-num-replicas 50 \
    --scale-in-control max-scaled-in-replicas=MAX_SCALE_IN_REPLICAS,time-window=TIME_WINDOW

Configurare i controlli di scale in durante l'aggiornamento di un gestore della scalabilità automatica

Aggiorna i controlli di scale in nel gestore della scalabilità automatica esistente di un gruppo di istanze gestite utilizzando il flag --scale-in-control con il comando gcloud compute instance-groups managed update-autoscaling. Ad esempio, utilizza il comando seguente per impostare i controlli di scale in in una configurazione di scalabilità automatica esistente per example-group:

gcloud compute instance-groups managed update-autoscaling INSTANCE_GROUP_NAME \
    --scale-in-control max-scaled-in-replicas=MAX_SCALE_IN_REPLICAS,time-window=TIME_WINDOW

Sostituisci quanto segue:

  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite da aggiornare.
  • MAX_SCALE_IN_REPLICAS: il numero massimo di VM che è possibile detrarre dalla dimensione massima, preso dalla finestra temporale specificata. Il numero specificato di istanze VM può essere scalato tutte insieme, quindi il tuo servizio dovrebbe permettersi di perdere tutte queste VM contemporaneamente. Puoi specificare un numero di VM o una percentuale. Utilizza il simbolo % per le percentuali, ad esempio: 50%.
  • TIME_WINDOW: finestra temporale finale da cui ricavare la dimensione massima. La scalabilità automatica non eseguirà fare lo scale in di un valore superiore al numero massimo consentito di repliche dalla dimensione massima raggiunta durante questo periodo di tempo finale. Specifica questo valore in secondi in un intervallo di [60, 3600].

Ad esempio, supponiamo che tu abbia impostato la finestra temporale su 1800 secondi (30 minuti). Durante il calcolo della dimensione consigliata corrente per il gruppo di istanze gestite, il gestore della scalabilità automatica utilizza la seguente logica:

  • Prendi la dimensione massima degli ultimi 30 minuti (ad esempio, 100 VM)
  • Prendi max-scaled-in-replicas (ad esempio, 10 VM)
  • Imposta il limite inferiore della dimensione consigliata su: dimensione massima meno max-scaled-in-replicas (100 - 10 = 90 VM)

REST

Configura i controlli dello scale in impostando i campi maxScaledInReplicas e timeWindowSec all'interno della struttura autoscalingPolicy.scaleInControl in una risorsa del gestore della scalabilità automatica a livello di zona o regionale. Non esistono valori predefiniti per questi campi. Devi fornire valori per entrambi.

Puoi configurare i controlli di scale in quando crei un gestore della scalabilità automatica o quando aggiorni un gestore della scalabilità automatica.

Configurare i controlli di scale in durante la creazione di un gestore della scalabilità automatica

Per un gruppo di istanze gestite a livello di zona, utilizza il metodo autoscalers.insert. Per un gruppo di istanze gestite a livello di regione, utilizza il metodo regionAutoscalers.insert.

POST
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/autoscalers

{
  "name": "AUTOSCALER_NAME",
  "target": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/INSTANCE_GROUP_NAME",
  "autoscalingPolicy": {
    "minNumReplicas": 1,
    "maxNumReplicas": 5,
    "coolDownPeriodSec": 60,
    "cpuUtilization": {
      "utilizationTarget": 0.8
    },
    "scaleInControl": {
      "maxScaledInReplicas": {
           "fixed": MAX_SCALE_IN_REPLICAS
      },
      "timeWindowSec": TIME_WINDOW
    }
  }
}

Per ulteriori informazioni sulla creazione di un gestore della scalabilità automatica, consulta i seguenti articoli:

Configurare i controlli di scale in durante l'aggiornamento di un gestore della scalabilità automatica

Per un gruppo di istanze gestite a livello di zona, utilizza il metodo autoscalers.patch. Per un gruppo di istanze gestite a livello di regione, utilizza il metodo regionAutoscalers.patch.

PATCH
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/autoscalers?autoscaler=AUTOSCALER_NAME

{
  "autoscalingPolicy": {
    "minNumReplicas": 1,
    "maxNumReplicas": 5,
    "coolDownPeriodSec": 60,
    "cpuUtilization": {
      "utilizationTarget": 0.8
    },
    "scaleInControl": {
      "maxScaledInReplicas": {
           "fixed": MAX_SCALE_IN_REPLICAS
      },
      "timeWindowSec": TIME_WINDOW
    }
  }
}

Sostituisci quanto segue:

  • AUTOSCALER_NAME: il nome del gestore della scalabilità automatica da creare. Puoi assegnare al gestore della scalabilità automatica un nome diverso dal gruppo di istanze gestite che lo utilizzerà o assegnargli un nome diverso.
  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite a cui aggiungere il gestore della scalabilità automatica. Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE con regions/REGION.
  • MAX_SCALE_IN_REPLICAS: il numero massimo di VM che è possibile detrarre dalla dimensione target massima consigliata, preso dalla finestra temporale specificata. Il numero specificato di istanze VM può essere scalato tutte insieme, quindi il tuo servizio dovrebbe permettersi di perdere tutte queste VM contemporaneamente. Puoi specificare un numero di VM o una percentuale. Utilizza maxScaledInReplicas.percentage per specificare un valore percentuale.
  • TIME_WINDOW: la finestra temporale finale da cui prendere la dimensione massima consigliata. La scalabilità automatica non eseguirà fare lo scale in di un valore superiore al numero massimo consentito di repliche dalla dimensione massima consigliata preso in considerazione durante questo intervallo di tempo finale. Specifica questo valore in secondi in un intervallo [60, 3600]; ad esempio: 1800.

Ad esempio, supponiamo che tu abbia impostato la finestra temporale su 1800 secondi (30 minuti). Durante il calcolo della dimensione consigliata corrente per il gruppo di istanze gestite, il gestore della scalabilità automatica utilizza la seguente logica:

  • Prendi la dimensione massima degli ultimi 30 minuti (ad esempio, 100 VM)
  • Prendi max-scaled-in-replicas (ad esempio, 10 VM)
  • Imposta il limite inferiore della dimensione consigliata su: dimensione massima meno max-scaled-in-replicas (100 - 10 = 90 VM)

Per ulteriori informazioni su come funzionano i controlli di scale in, consulta Comprendere le decisioni del gestore della scalabilità automatica.

Recupero della configurazione attuale dei controlli di scale in

Per ottenere la configurazione attuale dei controlli di scale in, consulta Ottenere informazioni su un gestore della scalabilità automatica.

Rimozione dei controlli di scale in in corso...

Puoi rimuovere i controlli di scale in per rimuovere le limitazioni sui tempi e sull'entità delle operazioni di scale in utilizzando Google Cloud CLI o l'API Compute Engine.

Senza i controlli di scale in, il gestore della scalabilità automatica si basa ancora sul suo meccanismo di stabilizzazione predefinito. In particolare, mantiene le dimensioni consigliate al livello necessario per gestire i picchi di carico, osservati durante il periodo di stabilizzazione.

Console

Per rimuovere i controlli di scale in per un gruppo di istanze gestite con scalabilità automatica:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite con scalabilità automatica nell'elenco per aprire la pagina della panoramica del gruppo.

  3. Fai clic su Modifica per visualizzare la configurazione attuale del gruppo, incluse le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, fai clic su Controlli di scale in, poi deseleziona la casella di controllo Attiva controlli di scale in.

  5. Fai clic su Salva.

gcloud

Rimuovi i controlli di scale in utilizzando il flag --clear-scale-in-control con il comando gcloud compute instance-groups managed update-autoscaling. Ad esempio, utilizza il comando seguente per rimuovere i controlli di scale in dalla configurazione della scalabilità automatica per example-group:

gcloud compute instance-groups managed update-autoscaling example-group \
    --clear-scale-in-control

REST

Per rimuovere i controlli di scale in, utilizza il metodo autoscalers.patch per un gruppo di istanze gestite a livello di zona oppure il metodo regionAutoscalers.patch per un gruppo di istanze gestite a livello di regione e fornisci una configurazione vuota per i controlli di scale in.

PATCH
https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers?autoscaler=AUTOSCALER_NAME

{
  "autoscalingPolicy": {
    "scaleInControl": null
  }
}

Sostituisci quanto segue:

  • AUTOSCALER_NAME: il nome del gestore della scalabilità automatica da aggiornare. Per ottenere un elenco dei gestori della scalabilità automatica esistenti e dei relativi gruppi di istanze gestite di destinazione, utilizza il metodo autoscalers.aggregatedList.

Eliminazione di un gestore della scalabilità automatica

Puoi eliminare definitivamente la risorsa del gestore della scalabilità automatica e la relativa cronologia. Se vuoi interrompere temporaneamente la scalabilità automatica e mantenere la risorsa del gestore della scalabilità automatica e la relativa configurazione e cronologia, disabilita il gestore della scalabilità automatica.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic sul nome di un gruppo di istanze gestite nell'elenco per aprire la pagina di riepilogo del gruppo.

  3. Fai clic su Modifica per visualizzare la configurazione attuale del gruppo, incluse le impostazioni di scalabilità automatica.

  4. In Scalabilità automatica, dall'elenco a discesa Modalità di scalabilità automatica seleziona Elimina configurazione di scalabilità automatica per interrompere il gestore della scalabilità automatica ed eliminare la configurazione.

  5. Al termine, fai clic su Salva.

gcloud

Utilizza il comando stop-autoscaling per arrestare un gestore della scalabilità automatica ed eliminare la sua configurazione.

gcloud compute instance-groups managed stop-autoscaling INSTANCE_GROUP_NAME

L'arresto di un gestore della scalabilità automatica lo elimina dal gruppo di istanze gestite. Se vuoi riavviare il gestore della scalabilità automatica, devi ricrearlo utilizzando il comando set-autoscaling.

Se elimini un gruppo di istanze gestite utilizzando gcloud CLI, vengono eliminati anche tutti i gestori della scalabilità automatica collegati al gruppo di istanze gestite.

REST

Per arrestare un gestore della scalabilità automatica ed eliminarne la configurazione, utilizza il metodo autoscalers.delete per un gruppo di istanze gestite a livello di zona oppure il metodo regionAutoscalers.delete per un gruppo di istanze gestite a livello di regione.

 DELETE https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/AUTOSCALER_NAME

Feedback

Vogliamo conoscere i tuoi casi d'uso, le tue sfide e i tuoi feedback sulla scalabilità automatica. Condividi il tuo feedback con il nostro team all'indirizzo mig-discuss@google.com.

Passaggi successivi