Accelera lo scale out con le VM sospese e arrestate


Questo documento spiega come funziona il pool di standby delle istanze di macchine virtuali (VM) sospese e arrestate e come puoi utilizzarlo per accelerare l'espansione di un gruppo di istanze gestite (MIG).

Prima di iniziare

  • Consulta la pagina introduttiva sulle VM sospese e arrestate in un gruppo di istanze gestite.
  • Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione è la procedura mediante la quale la tua identità viene verificata per l'accesso alle API e ai servizi Google Cloud. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Install the Google Cloud CLI, then initialize it by running the following command:

      gcloud init
    2. Set a default region and zone.
    3. REST

      Per utilizzare gli esempi dell'API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali fornite a gcloud CLI.

        Install the Google Cloud CLI, then initialize it by running the following command:

        gcloud init

      Per saperne di più, consulta Eseguire l'autenticazione per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud.

Utilizzare l'API MIG per la scalabilità automatica

Ti consigliamo di utilizzare lo strumento di scalabilità automatica di Compute Engine per la scalabilità automatica del tuo MIG. Tuttavia, se per qualche motivo preferisci utilizzare un altro programma di ridimensionamento automatico, utilizza gli endpoint dell'API MIG per gestire le VM sospese e arrestate.

Scegli tra pool sospesi e pool arrestati

La scelta tra pool sospesi e arrestati dipende dal caso d'uso specifico. Per ottenere il massimo rendimento, ti consigliamo di sperimentare diversi tipi di pool di standby per i tuoi scenari di scalabilità per determinare quale soddisfa meglio le tue esigenze. Carichi di lavoro diversi potrebbero mostrare tempi di pubblicazione più brevi con opzioni diverse. In alcuni casi, l'operazione di copia dello stato della memoria dallo spazio di archiviazione alla VM potrebbe richiedere più tempo del riavvio della VM o della creazione di una nuova VM da zero.

Per trovare l'approccio migliore, parti da queste linee guida:

  • Utilizza le VM sospese se richiedono un'inizializzazione della memoria che richiede tempo, poiché le VM sospese preservano lo stato della memoria. Assicurati che l'applicazione possa essere sospesa e ripresa. Il mantenimento dello stato della memoria richiede spazio di archiviazione aggiuntivo e potrebbe comportare costi aggiuntivi.
  • Utilizza le VM arrestate se l'inizializzazione della VM si concentra principalmente sull'inizializzazione dei dati memorizzati nei dischi permanenti.

Modificare il criterio di standby in un gruppo di istanze gestite

Questa sezione descrive come impostare il ritardo iniziale e come impostare la modalità del pool di standby sul pool di scalabilità orizzontale.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Nella colonna Nome dell'elenco, fai clic sul nome del gruppo di istanze in cui vuoi modificare il criterio di standby.

  3. Fai clic su Modifica per modificare questo gruppo di istanze gestite.

  4. Fai clic su Mostra configurazione avanzata.

  5. Nella sezione Pool di standby, in Modalità, seleziona Scalabilità orizzontale.

  6. Nel campo Ritardo iniziale, inserisci il numero di secondi che il MIG deve attendere prima di sospendere o arrestare una VM. Il ritardo iniziale consente allo script di inizializzazione di preparare la VM per lo scale out rapido.

  7. Fai clic su Salva.

gcloud

Utilizza il comando beta instance-groups managed update e specifica la modalità di funzionamento e il ritardo iniziale.

gcloud beta compute instance-groups managed update MIG_NAME \
  --standby-policy-mode=scale-out-pool \
  --standby-policy-initial-delay=DELAY \
  [--region=REGION | --zone=ZONE]

Sostituisci quanto segue:

  • MIG_NAME: il nome del gruppo di istanze gestite.
  • DELAY: il numero di secondi che il MIG deve attendere prima di sospendere o arrestare una VM. Il ritardo iniziale consente allo script di inizializzazione di preparare la VM per lo scale out rapido.
  • REGION: per un gruppo di istanze gestite a livello di regione, la regione in cui si trova il gruppo di istanze gestite.
  • ZONE: per un gruppo di istanze gestite a livello di zona, la zona in cui si trova il gruppo di istanze gestite.

API

Utilizza il metodo instanceGroupManager.update e specifica la modalità di operazione e il ritardo iniziale nel corpo della richiesta. Per i gruppi di istanze gestite a livello di regione, utilizza il metodo regionInstanceGroupManager.update.

PUT https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME

{
// ...
"standbyPolicy": {
  "mode": "SCALE_OUT_POOL",
  "initialDelaySec": DELAY
}
// ...
}

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto.
  • ZONE: per un gruppo di istanze gestite a livello di zona, la zona in cui si trova il gruppo di istanze gestite.
    • Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE con regions/REGION e specifica la regione del gruppo di istanze gestite.
  • MIG_NAME: il nome del gruppo di istanze gestite.
  • DELAY: il numero di secondi che il MIG deve attendere prima di sospendere o arrestare una VM. Il ritardo iniziale consente allo script di inizializzazione di preparare la VM per lo scale out rapido.

Ridimensiona il pool di standby in un gruppo di istanze gestite

Questa sezione descrive come ridimensionare i pool di VM sospese e arrestate in un gruppo di istanze gestite.

Console

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Nella colonna Nome dell'elenco, fai clic sul nome del gruppo di istanze in cui vuoi modificare le dimensioni del pool di standby.

  3. Fai clic su Modifica per modificare questo gruppo di istanze gestite.

  4. Fai clic su Mostra configurazione avanzata.

  5. Nella sezione Pool in standby, inserisci le nuove dimensioni nei campi VM sospese e VM arrestate.

  6. Fai clic su Salva.

gcloud

Utilizza il comando beta instance-groups managed update con i flag --suspended-size e --stopped-size.

gcloud beta compute instance-groups managed update MIG_NAME \
--suspended-size=SUSPENDED_SIZE \
--stopped-size=STOPPED_SIZE \
[--region=REGION | --zone=ZONE]

Sostituisci quanto segue:

  • MIG_NAME: il nome del gruppo di istanze gestite in cui sospendere un'istanza.
  • SUSPENDED_SIZE: il numero di VM sospese che il gruppo di istanze gestite deve mantenere in un determinato momento.
  • STOPPED_SIZE: il numero di VM arrestate che il gruppo di istanze gestite deve mantenere in un determinato momento.
  • REGION: per un gruppo di istanze gestite a livello di regione, la regione in cui si trova il gruppo di istanze gestite.
  • ZONE: per un gruppo di istanze gestite a livello di zona, la zona in cui si trova il gruppo di istanze gestite.

API

Utilizza il metodo instanceGroupManager.update e specifica le dimensioni dei pool di VM sospese e arrestate nel corpo della richiesta. Per i gruppi di istanze gestite a livello di regione, utilizza il metodo regionInstanceGroupManager.update.

PUT https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME

{
// ...
"targetSuspendedSize": SUSPENDED_SIZE,
"targetStoppedSize": STOPPED_SIZE
// ...
}

Sostituisci quanto segue:

  • PROJECT_ID: l'ID progetto per la richiesta.
  • ZONE: per un gruppo di istanze gestite a livello di zona, la zona in cui si trova il gruppo di istanze gestite.
    • Per un gruppo di istanze gestite a livello di regione, sostituisci zones/ZONE con regions/REGION e specifica la regione del gruppo di istanze gestite.
  • MIG_NAME: il nome del gruppo di istanze gestite in cui interrompere un'istanza.
  • SUSPENDED_SIZE: il numero di VM sospese che il gruppo di istanze gestite deve mantenere in un determinato momento.
  • STOPPED_SIZE: il numero di VM arrestate che il gruppo di istanze gestite deve mantenere in un determinato momento.

Passaggi successivi