Crea richieste di ridimensionamento in un gruppo di istanze gestite


Questo documento descrive come creare richieste di ridimensionamento in un gruppo di istanze gestite (MIG) di istanze di macchine virtuali (VM) con GPU collegate.

Prima di iniziare

  • Esamina come funzionano le richieste di ridimensionamento.
  • Per assicurarti di avere una quota GPU sufficiente per le risorse che stai richiedere, controlla la quota GPU.
  • Se non l'hai già fatto, configura l'autenticazione. Autenticazione è Il processo di verifica dell'identità per l'accesso ai servizi e alle API di Google Cloud. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi eseguire l'autenticazione Compute Engine come segue.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Install the Google Cloud CLI, then initialize it by running the following command:

      gcloud init
    2. Set a default region and zone.
    3. REST

      Per utilizzare gli esempi dell'API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali fornite a gcloud CLI.

        Install the Google Cloud CLI, then initialize it by running the following command:

        gcloud init

      Per ulteriori informazioni, vedi Esegui l'autenticazione per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare richieste di ridimensionamento in un gruppo di istanze gestite, chiedi all'amministratore di concederti il ruolo IAM Amministratore istanze Compute (v1) (roles/compute.instanceAdmin.v1) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene le autorizzazioni necessarie per creare richieste di ridimensionamento in un gruppo di istanze gestite. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:

Autorizzazioni obbligatorie

Per creare richieste di ridimensionamento in un gruppo di istanze gestite, sono necessarie le seguenti autorizzazioni:

  • Per creare un modello di istanza: compute.instanceTemplates.create del progetto
  • Per creare un gruppo di istanze gestite a livello di zona: compute.instanceGroupManagers.create del progetto
  • Per creare richieste di ridimensionamento in un gruppo di istanze gestite: compute.instanceGroupManagers.update del progetto

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

prepara un gruppo di istanze gestite per le richieste di ridimensionamento

Per creare richieste di ridimensionamento in un gruppo di istanze gestite, devi configurare un modello di istanza e il gruppo di istanze gestite come descritto nelle sezioni seguenti.

Crea un modello di istanza

Se vuoi creare richieste di ridimensionamento in un gruppo di istanze gestite, il gruppo deve utilizzare un modello di istanza con le seguenti configurazioni:

Console

Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite:

  1. Nella console Google Cloud, vai alla pagina Modelli di istanza.

    Vai a Modelli di istanza

  2. Fai clic su Crea modello istanza.

  3. Nel campo Nome, inserisci un nome per il modello di istanza.

  4. Nella sezione Località, seleziona una delle seguenti opzioni:

    • Per creare un modello di istanza globale, seleziona Globale (valore predefinito).

    • Per creare un modello di istanza regionale, seleziona A livello di regione e quindi seleziona la regione in cui vuoi creare l'istanza modello.

  5. Nella sezione Configurazione macchina, segui questi passaggi:

    1. Fai clic sulla scheda GPU.

    2. Nell'elenco Tipo di GPU, seleziona il tipo di GPU.

    3. Nell'elenco Numero di GPU, seleziona il numero di GPU.

    4. (Facoltativo) Se il modello GPU supporta Workstation virtuali (vWS) NVIDIA RTX per carichi di lavoro di grafica e prevedi di eseguire carichi di lavoro ad alta intensità di grafica, seleziona Abilita workstation virtuale (NVIDIA GRID).

    5. Nella sezione Tipo di macchina, seleziona un tipo di macchina.

  6. (Facoltativo) Per modificare il tipo di disco di avvio o l'immagine del valore predefinito, nella sezione Nella sezione Disco di avvio, fai clic su Cambia. Poi segui le istruzioni per cambiare il disco di avvio.

  7. Espandi la sezione Opzioni avanzate e segui questi passaggi:

    1. Espandi la sezione Gestione.

    2. Nell'elenco Prenotazioni, seleziona Non utilizzare.

  8. Fai clic su Crea.

gcloud

Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite, utilizza il comando instance-templates create con i seguenti flag:

  • Il flag --maintenance-policy impostato su TERMINATE.

  • Il flag --reservation-affinity impostato su none.

Ad esempio, utilizza il seguente comando:

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --image-project=IMAGE_PROJECT \
    --image-family=IMAGE_FAMILY \
    --machine-type=MACHINE_TYPE \
    --maintenance-policy=TERMINATE \
    --reservation-affinity=none

Sostituisci quanto segue:

  • INSTANCE_TEMPLATE_NAME: il nome del modello di istanza da creare.

  • IMAGE_PROJECT: il progetto immagine che contiene image; ad esempio debian-cloud. Per saperne di più sui progetti di immagini supportati, consulta Immagini pubbliche.

  • IMAGE_FAMILY o IMAGE: specificane uno dei seguenti:

    • IMAGE_FAMILY: un famiglia di immagini. Specifica l'immagine del sistema operativo più recente e non ritirata. Ad esempio, se specifichi debian-10, l'ultima versione della famiglia di immagini Debian 10 è in uso. Per saperne di più sull'utilizzo delle famiglie di immagini, consulta le best practice per le famiglie di immagini.

    • IMAGE: una versione specifica dell'immagine del sistema operativo; della ad esempio debian-10-buster-v20200309. Se scegli di specificare una versione specifica dell'immagine del sistema operativo, devi sostituire il flag --image-family con il flag --image.

  • MACHINE_TYPE: un tipo di macchina che supporta le GPU. Se specifica un tipo di macchina N1, quindi includi --accelerator flag per specificare il numero e il tipo di GPU da collegare alle VM.

REST

Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite, effettua una richiesta POST al Metodo instanceTemplates.insert. Nel corpo della richiesta:

  • Imposta il campo scheduling.onHostMaintenance su TERMINATE.

  • Imposta il campo reservationAffinity.consumeReservationType su NO_RESERVATION.

Ad esempio, effettua una richiesta POST come segue:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/instanceTemplates

{
  "name": "INSTANCE_TEMPLATE_NAME",
  "properties": {
    "disks": [
      {
        "boot": true,
        "mode": "READ_WRITE",
        "type": "PERSISTENT",
        "initializeParams": {
          "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE"
        }
      }
    ],
    "machineType": "MACHINE_TYPE",
    "networkInterfaces": [
      {
        "accessConfigs": [
          {
            "name": "external-IP",
            "type": "ONE_TO_ONE_NAT"
          }
        ],
        "network": "global/networks/default"
      }
    ],
    "reservationAffinity": {
      "consumeReservationType": "NO_RESERVATION"
    },
    "scheduling": {
      "onHostMaintenance": "TERMINATE"
    }
  }
}

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto in cui creare il modello di istanza.

  • INSTANCE_TEMPLATE_NAME: il nome dell'istanza un modello da creare.

  • IMAGE_PROJECT: il progetto immagine che contiene l'immagine, ad esempio debian-cloud. Per ulteriori informazioni sui per i progetti immagine supportati, consulta Immagini pubbliche.

  • IMAGE o IMAGE_FAMILY: specifica una delle seguenti opzioni:

    • IMAGE: una versione specifica dell'immagine del sistema operativo; della ad esempio debian-10-buster-v20200309.

    • IMAGE_FAMILY: una famiglia di immagini. Specifica l'immagine del sistema operativo più recente e non ritirata. Ad esempio, se specifichi family/debian-10, la versione più recente della famiglia di immagini Debian 10 . Per ulteriori informazioni sull'utilizzo delle famiglie di immagini, consulta Best practice per le famiglie di immagini.

  • MACHINE_TYPE: un tipo di macchina supporta le GPU. Se specifichi un tipo di macchina N1, includi il campo guestAccelerators nel corpo della richiesta per specificare il numero e il tipo di GPU da collegare alle VM.

Per ulteriori informazioni sulla creazione di un modello di istanza, consulta Creare modelli di istanza.

Creare o aggiornare un gruppo di istanze gestite

Dopo aver creato il modello di istanza come descritto nella sezione precedente, utilizzalo per creare un gruppo di istanze gestite come segue o per aggiornarne uno. Inoltre, per preparare il gruppo di istanze gestite per le richieste di ridimensionamento:

Console

Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, segui questi passaggi: seguenti:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic su Crea gruppo di istanze.

    Si apre la pagina Crea gruppo di istanze.

  3. Nel campo Nome, inserisci un nome per il gruppo di istanze gestite.

  4. Nell'elenco Modello di istanza, seleziona il modello di istanza creato nella sezione precedente. Se selezioni un modello di istanza regionale, l'elenco Regione viene impostato sulla regione del modello di istanza.

  5. Nella sezione Località:

    1. Seleziona Zona singola (impostazione predefinita).

    2. Seleziona la Regione e la Zona del gruppo di istanze gestite.

  6. Per eliminare la configurazione della scalabilità automatica:

    1. Nella sezione Scalabilità automatica, fai clic sull'elenco Modalità di scalabilità automatica. e fai clic su Elimina configurazione scalabilità automatica.

    2. Nella finestra di dialogo di conferma, fai clic su Elimina.

  7. Per disattivare le riparazioni, nella sezione Ciclo di vita dell'istanza VM fai clic sull'icona Azione predefinita in caso di errore, quindi seleziona Nessuna azione.

  8. Esegui una di queste operazioni:

    • A questo punto, per creare una richiesta di ridimensionamento:

      1. Nel campo Numero di istanze, inserisci il numero di VM che vuoi creare contemporaneamente.

        Il campo Numero di istanze nella pagina Crea gruppo di istanze.

      2. Seleziona Utilizza la richiesta di ridimensionamento per creare tutte le VM contemporaneamente casella di controllo.

      3. Nel campo Durata esecuzione richiesta e nell'elenco Unità, specifica la durata di esecuzione delle VM. La durata deve essere compresa tra 1 ora e 7 giorni.

    • Altrimenti, nel campo Numero di istanze, inserisci 0. Puoi in un secondo momento, aggiungi le VM nel gruppo creazione di richieste di ridimensionamento.

  9. Fai clic su Crea.

gcloud

Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, utilizza il comando instance-groups managed create con il flag --default-action-on-vm-failure impostato su do_nothing.

gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \
    --template=INSTANCE_TEMPLATE_NAME \
    --size=0 \
    --zone=ZONE \
    --default-action-on-vm-failure=do_nothing

Sostituisci quanto segue:

  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite da creare.

  • INSTANCE_TEMPLATE_NAME: il nome del modello di istanza che hai creato nella sezione precedente.

  • ZONE: la zona in cui creare il gruppo di istanze gestite.

REST

Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, crea un POST richiesta alla Metodo instanceGroupManagers.insert. Nel corpo della richiesta, includi il campo defaultActionOnFailure impostato su DO_NOTHING.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers

{
  "versions": [
    {
      "instanceTemplate": "global/instanceTemplates/INSTANCE_TEMPLATE_NAME"
    }
  ],
  "name": "INSTANCE_GROUP_NAME",
  "targetSize": 0,
  "instanceLifecyclePolicy": {
    "defaultActionOnFailure": "DO_NOTHING"
  }
}

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto in cui è stata inserita l'istanza che hai creato nella sezione precedente.

  • ZONE: la zona in cui creare il gruppo di istanze gestite.

  • INSTANCE_TEMPLATE_NAME: il nome dell'istanza creato nella sezione precedente.

  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite da creare.

Creare una richiesta di ridimensionamento in un gruppo di istanze gestite

Prima di creare richieste di ridimensionamento, assicurati di avere aver preparato il gruppo di istanze gestite come descritto nella sezione precedente.

Dopo aver creato una richiesta di ridimensionamento e tutte le risorse richieste diventano disponibili, il gruppo di istanze gestite crea contemporaneamente il numero richiesto di VM. Le VM vengono eseguite finché il gruppo di istanze gestite non li elimina al termine della durata dell'esecuzione specificata o finché eliminarle.

Console

Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Nella colonna Nome, fai clic sul nome del gruppo di istanze gestite in cui creare la richiesta di ridimensionamento.

    Viene visualizzata la pagina Panoramica del gruppo di istanze gestite.

  3. Nella riga Richieste di ridimensionamento, fai clic su Modifica richieste di ridimensionamento.

  4. Fai clic su Nuova richiesta di ridimensionamento.

    Viene visualizzato il riquadro Nuove richieste di ridimensionamento.

  5. Nel campo Nome, inserisci il nome della richiesta di ridimensionamento.

  6. Nel campo Numero di istanze aggiuntive necessarie, inserisci il numero di VM da aggiungere al gruppo di istanze gestite con scalabilità automatica contemporaneamente.

  7. Nei campi Durata esecuzione richiesta e Unità, specifica per l'esecuzione delle VM richieste. La durata deve essere compresa tra 1 ora e 7 giorni.

  8. Fai clic su Crea.

gcloud

Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, utilizza il comando instance-groups managed resize-requests create.

gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \
    --resize-request=RESIZE_REQUEST_NAME \
    --resize-by=COUNT \
    --requested-run-duration=RUN_DURATION \
    --zone=ZONE

Sostituisci quanto segue:

  • INSTANCE_GROUP_NAME: il nome di un ambiente di zona esistente Gruppo di istanze gestite configurato per la creazione di richieste di ridimensionamento al suo interno.

  • RESIZE_REQUEST_NAME: il nome della richiesta di ridimensionamento, che deve essere univoco all'interno del gruppo di istanze gestite specificato. In caso contrario, la creazione della richiesta di ridimensionamento non va a buon fine.

  • COUNT: il numero di VM da aggiungere al MIG contemporaneamente.

  • RUN_DURATION: la durata desiderata per le VM richieste eseguire. Il formato del valore deve corrispondere al numero di giorni, ore, minuti o secondi seguiti rispettivamente da d, h, m e s. Per Ad esempio, specifica 30m per 30 minuti o 1d2h3m4s per 1 giorno, 2 ore, 3 minuti e 4 secondi. Il valore deve essere compreso tra 10 minuti e 7 giorni.

  • ZONE: la zona in cui si trova il gruppo di istanze gestite.

REST

Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, invia una richiesta POST al metodo instanceGroupManagerResizeRequests.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests

{
  "name": "RESIZE_REQUEST_NAME",
  "resizeBy": COUNT,
  "requestedRunDuration": {
    "seconds": "RUN_DURATION"
  }
}

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto in cui è stato specificato Il gruppo di istanze gestite si trova.

  • ZONE: la zona in cui si trova il gruppo di istanze gestite.

  • INSTANCE_GROUP_NAME: il nome di un MIG zonale esistente configurato per la creazione di richieste di ridimensionamento.

  • RESIZE_REQUEST_NAME: il nome della richiesta di ridimensionamento, che deve essere univoco all'interno del gruppo di istanze gestite specificato. In caso contrario, la creazione della richiesta di ridimensionamento non va a buon fine.

  • COUNT: il numero di VM da aggiungere contemporaneamente alla gruppo di istanze gestite

  • RUN_DURATION: la durata, in secondi, della durata ha richiesto l'esecuzione delle VM. Il valore deve essere compreso tra 600, ovvero 600 secondi (10 minuti) e 604800, che corrisponde a 604.800 secondi (7 giorni).

Passaggi successivi