Crea richieste di ridimensionamento in un gruppo di istanze gestite

Questo documento descrive come creare richieste di ridimensionamento in un un gruppo di istanze gestite di istanze di macchine virtuali (VM) che hanno con GPU collegate.

Prima di iniziare

  • Rivedi come funzionano le richieste di ridimensionamento.
  • Per assicurarti di avere una quota GPU sufficiente per le risorse che stai richiedere, controlla la quota GPU.
  • Se non l'hai già fatto, configura l'autenticazione. Autenticazione è Il processo di verifica dell'identità per l'accesso ai servizi e alle API di Google Cloud. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi eseguire l'autenticazione Compute Engine come segue.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Installa Google Cloud CLI, quindi initialize eseguendo questo comando:

      gcloud init
    2. Set a default region and zone.
    3. REST

      Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.

        Installa Google Cloud CLI, quindi initialize eseguendo questo comando:

        gcloud init

      Per ulteriori informazioni, vedi Esegui l'autenticazione per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare richieste di ridimensionamento in un gruppo di istanze gestite, chiedi all'amministratore di concederti Ruolo IAM Amministratore istanze Compute (v1) (roles/compute.instanceAdmin.v1) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.

Questo ruolo predefinito contiene le autorizzazioni necessarie per creare richieste di ridimensionamento in un gruppo di istanze gestite. Per vedere le autorizzazioni esatte obbligatorie, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per creare richieste di ridimensionamento in un gruppo di istanze gestite, sono necessarie le seguenti autorizzazioni:

  • Per creare un modello di istanza: compute.instanceTemplates.create del progetto
  • Per creare un gruppo di istanze gestite a livello di zona: compute.instanceGroupManagers.create del progetto
  • Per creare richieste di ridimensionamento in un gruppo di istanze gestite: compute.instanceGroupManagers.update del progetto

Potresti anche riuscire a ottenere queste autorizzazioni con ruoli personalizzati e altri ruoli predefiniti.

prepara un gruppo di istanze gestite per le richieste di ridimensionamento

Per creare richieste di ridimensionamento in un gruppo di istanze gestite, devi configurare un modello di istanza e gruppo di istanze gestite, come descritto nelle sezioni seguenti.

Crea un modello di istanza

Se vuoi creare richieste di ridimensionamento in un gruppo di istanze gestite, quest'ultimo deve utilizzare un modello di istanza con le seguenti configurazioni:

Console

Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Modelli di istanza.

    Vai a Modelli di istanza

  2. Fai clic su Crea modello istanza.

  3. Nel campo Nome, inserisci un nome per il modello di istanza.

  4. Nella sezione Località, seleziona una delle seguenti opzioni:

    • Per creare un modello di istanza globale, seleziona Globale (impostazione predefinita).

    • Per creare un modello di istanza regionale, seleziona A livello di regione e quindi seleziona la regione in cui vuoi creare l'istanza modello.

  5. Nella sezione Configurazione macchina, segui questi passaggi:

    1. Fai clic sulla scheda GPU.

    2. Nell'elenco Tipo di GPU, seleziona il tipo di GPU.

    3. Nell'elenco Numero di GPU, seleziona il numero di GPU.

    4. (Facoltativo) Se il modello GPU supporta Workstation virtuali (vWS) NVIDIA RTX per carichi di lavoro di grafica e prevedi di eseguire carichi di lavoro ad alta intensità di grafica, seleziona Abilita workstation virtuale (NVIDIA GRID).

    5. Nella sezione Tipo di macchina, seleziona un tipo di macchina.

  6. (Facoltativo) Per modificare il tipo di disco di avvio o l'immagine del valore predefinito, nella sezione Nella sezione Disco di avvio, fai clic su Cambia. Poi segui le istruzioni per e modificare il disco di avvio.

  7. Espandi la sezione Opzioni avanzate ed esegui la seguenti:

    1. Espandi la sezione Gestione.

    2. Nell'elenco Prenotazioni, seleziona Non utilizzare.

  8. Fai clic su Crea.

gcloud

Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite, utilizza Comando instance-templates create con i seguenti flag:

  • Il flag --maintenance-policy impostato su TERMINATE.

  • Il flag --reservation-affinity impostato su none.

Ad esempio, utilizza il seguente comando:

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --image-project=IMAGE_PROJECT \
    --image-family=IMAGE_FAMILY \
    --machine-type=MACHINE_TYPE \
    --maintenance-policy=TERMINATE \
    --reservation-affinity=none

Sostituisci quanto segue:

  • INSTANCE_TEMPLATE_NAME: il nome dell'istanza un modello da creare.

  • IMAGE_PROJECT: il progetto immagine che contiene image; ad esempio debian-cloud. Per ulteriori informazioni sui per i progetti immagine supportati, consulta Immagini pubbliche.

  • IMAGE_FAMILY o IMAGE: specificane uno dei seguenti:

    • IMAGE_FAMILY: un famiglia di immagini. Questo specifica l'immagine del sistema operativo più recente e non deprecata. Ad esempio, se specifichi debian-10, l'ultima versione della famiglia di immagini Debian 10 è in uso. Per ulteriori informazioni sull'utilizzo delle famiglie di immagini, consulta Best practice per le famiglie di immagini.

    • IMAGE: una versione specifica dell'immagine del sistema operativo; della ad esempio debian-10-buster-v20200309. Se scegli di specificare specifica dell'immagine del sistema operativo, devi sostituire Bandiera --image-family con la bandiera --image.

  • MACHINE_TYPE: un tipo di macchina supporta le GPU. Se specifica un tipo di macchina N1, quindi includi --accelerator flag per specificare il numero e il tipo di GPU da collegare alle VM.

REST

Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite, effettua una richiesta POST al Metodo instanceTemplates.insert. Nel corpo della richiesta, segui questi passaggi:

  • Imposta il campo scheduling.onHostMaintenance su TERMINATE.

  • Imposta il campo reservationAffinity.consumeReservationType su NO_RESERVATION.

Ad esempio, effettua una richiesta POST come segue:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/instanceTemplates

{
  "name": "INSTANCE_TEMPLATE_NAME",
  "properties": {
    "disks": [
      {
        "boot": true,
        "mode": "READ_WRITE",
        "type": "PERSISTENT",
        "initializeParams": {
          "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE"
        }
      }
    ],
    "machineType": "MACHINE_TYPE",
    "networkInterfaces": [
      {
        "accessConfigs": [
          {
            "name": "external-IP",
            "type": "ONE_TO_ONE_NAT"
          }
        ],
        "network": "global/networks/default"
      }
    ],
    "reservationAffinity": {
      "consumeReservationType": "NO_RESERVATION"
    },
    "scheduling": {
      "onHostMaintenance": "TERMINATE"
    }
  }
}

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto in cui creare del modello di istanza.

  • INSTANCE_TEMPLATE_NAME: il nome dell'istanza un modello da creare.

  • IMAGE_PROJECT: il progetto immagine che contiene image; ad esempio debian-cloud. Per ulteriori informazioni sui per i progetti immagine supportati, consulta Immagini pubbliche.

  • IMAGE o IMAGE_FAMILY: specificane uno dei seguenti:

    • IMAGE: una versione specifica dell'immagine del sistema operativo; della ad esempio debian-10-buster-v20200309.

    • IMAGE_FAMILY: un famiglia di immagini. Questo specifica l'immagine del sistema operativo più recente e non deprecata. Ad esempio, se specifichi family/debian-10, la versione più recente della famiglia di immagini Debian 10 . Per ulteriori informazioni sull'utilizzo delle famiglie di immagini, consulta Best practice per le famiglie di immagini.

  • MACHINE_TYPE: un tipo di macchina supporta le GPU. Se specifica un tipo di macchina N1, quindi includi Campo guestAccelerators nel corpo della richiesta per specificare il numero e il tipo di GPU da collegare per le tue VM.

Per ulteriori informazioni sulla creazione di un modello di istanza, consulta Creare modelli di istanza.

Crea o aggiorna un gruppo di istanze gestite

Dopo aver creato il modello di istanza come descritto nella sezione precedente, utilizza quel modello di istanza per creare un gruppo di istanze gestite come segue aggiornare un gruppo di istanze gestite. Inoltre, per preparare il gruppo di istanze gestite per le richieste di ridimensionamento:

Console

Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, segui questi passaggi: seguenti:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Fai clic su Crea gruppo di istanze.

    Si apre la pagina Crea gruppo di istanze.

  3. Nel campo Nome, inserisci un nome per il gruppo di istanze gestite.

  4. Nell'elenco Modello di istanza, seleziona il modello di istanza creato nella sezione precedente. Se selezioni un'istanza a livello di regione l'elenco Regione è impostato sulla regione dell'istanza modello.

  5. Nella sezione Posizione, procedi nel seguente modo:

    1. Seleziona Zona singola (impostazione predefinita).

    2. Seleziona la regione e la zona del gruppo di istanze gestite.

  6. Per eliminare la configurazione della scalabilità automatica:

    1. Nella sezione Scalabilità automatica, fai clic sull'elenco Modalità di scalabilità automatica. e fai clic su Elimina configurazione scalabilità automatica.

    2. Nella finestra di dialogo di conferma, fai clic su Elimina.

  7. Per disattivare le riparazioni, nella sezione Ciclo di vita dell'istanza VM fai clic sull'icona Azione predefinita in caso di errore, quindi seleziona Nessuna azione.

  8. Esegui una di queste operazioni:

    • A questo punto, per creare una richiesta di ridimensionamento:

      1. Nel campo Numero di istanze, inserisci il numero di VM che vuoi creare contemporaneamente.

        Campo del numero di istanze nella pagina Crea gruppo di istanze.

      2. Seleziona Utilizza la richiesta di ridimensionamento per creare tutte le VM contemporaneamente casella di controllo.

      3. Nel campo Durata esecuzione richiesta e nell'elenco Unità, e specificare la durata di esecuzione delle VM. La durata deve essere tra 1 ora e 7 giorni.

    • Altrimenti, nel campo Numero di istanze, inserisci 0. Puoi in un secondo momento, aggiungi le VM nel gruppo creazione di richieste di ridimensionamento.

  9. Fai clic su Crea.

gcloud

Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, utilizza Comando instance-groups managed create con il flag --default-action-on-vm-failure impostato su do_nothing.

gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \
    --template=INSTANCE_TEMPLATE_NAME \
    --size=0 \
    --zone=ZONE \
    --default-action-on-vm-failure=do_nothing

Sostituisci quanto segue:

  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite da creare.

  • INSTANCE_TEMPLATE_NAME: il nome dell'istanza creato nella sezione precedente.

  • ZONE: la zona in cui creare il gruppo di istanze gestite.

REST

Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, crea un POST richiesta alla Metodo instanceGroupManagers.insert. Nel corpo della richiesta, includi il campo defaultActionOnFailure impostato su DO_NOTHING.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers

{
  "versions": [
    {
      "instanceTemplate": "global/instanceTemplates/INSTANCE_TEMPLATE_NAME"
    }
  ],
  "name": "INSTANCE_GROUP_NAME",
  "targetSize": 0,
  "instanceLifecyclePolicy": {
    "defaultActionOnFailure": "DO_NOTHING"
  }
}

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto in cui è stata inserita l'istanza che hai creato nella sezione precedente.

  • ZONE: la zona in cui creare il gruppo di istanze gestite.

  • INSTANCE_TEMPLATE_NAME: il nome dell'istanza creato nella sezione precedente.

  • INSTANCE_GROUP_NAME: il nome del gruppo di istanze gestite da creare.

Crea una richiesta di ridimensionamento in un gruppo di istanze gestite

Prima di creare richieste di ridimensionamento, assicurati di avere aver preparato il gruppo di istanze gestite come descritto nella sezione precedente.

Dopo aver creato una richiesta di ridimensionamento e tutte le risorse richieste diventano disponibili, il gruppo di istanze gestite crea contemporaneamente il numero richiesto di VM. Le VM vengono eseguite finché il gruppo di istanze gestite non li elimina al termine della durata dell'esecuzione specificata o finché eliminarle.

Console

Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Gruppi di istanze.

    Vai a Gruppi di istanze

  2. Nella colonna Nome, fai clic sul nome del gruppo di istanze gestite in cui creare il richiesta di ridimensionamento.

    Viene visualizzata la pagina Panoramica del gruppo di istanze gestite.

  3. Nella riga Richieste di ridimensionamento, fai clic su Modifica le richieste di ridimensionamento.

  4. Fai clic su Nuova richiesta di ridimensionamento.

    Viene visualizzato il riquadro Nuove richieste di ridimensionamento.

  5. Nel campo Nome, inserisci il nome della richiesta di ridimensionamento.

  6. Nel campo Numero di istanze aggiuntive necessarie, inserisci il numero di VM da aggiungere al gruppo di istanze gestite contemporaneamente.

  7. Nei campi Durata esecuzione richiesta e Unità, specifica per l'esecuzione delle VM richieste. La durata deve essere compresa tra 1 ora e 7 giorni.

  8. Fai clic su Crea.

gcloud

Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, utilizza la classe Comando instance-groups managed resize-requests create.

gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \
    --resize-request=RESIZE_REQUEST_NAME \
    --resize-by=COUNT \
    --requested-run-duration=RUN_DURATION \
    --zone=ZONE

Sostituisci quanto segue:

  • INSTANCE_GROUP_NAME: il nome di un ambiente di zona esistente Gruppo di istanze gestite configurato per la creazione di richieste di ridimensionamento al suo interno.

  • RESIZE_REQUEST_NAME: il nome della richiesta di ridimensionamento, che deve essere univoco all'interno del gruppo di istanze gestite specificato. In caso contrario, la creazione la richiesta di ridimensionamento non riesce.

  • COUNT: il numero di VM da aggiungere al gruppo di istanze gestite in tutto una volta sola.

  • RUN_DURATION: la durata desiderata per le VM richieste eseguire. Il formato del valore deve corrispondere al numero di giorni, ore, minuti o secondi seguiti rispettivamente da d, h, m e s. Per Ad esempio, specifica 30m per 30 minuti o 1d2h3m4s per 1 giorno, 2 ore, 3 minuti e 4 secondi. Il valore deve essere compreso tra 10 minuti e 7 giorni.

  • ZONE: la zona in cui si trova il gruppo di istanze gestite.

REST

Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, effettua una richiesta POST al Metodo instanceGroupManagerResizeRequests.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests

{
  "name": "RESIZE_REQUEST_NAME",
  "resizeBy": COUNT,
  "requestedRunDuration": {
    "seconds": "RUN_DURATION"
  }
}

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto in cui è stato specificato Il gruppo di istanze gestite si trova.

  • ZONE: la zona in cui si trova il gruppo di istanze gestite.

  • INSTANCE_GROUP_NAME: il nome di un ambiente di zona esistente Gruppo di istanze gestite configurato per la creazione di richieste di ridimensionamento al suo interno.

  • RESIZE_REQUEST_NAME: il nome della richiesta di ridimensionamento, che deve essere univoco all'interno del gruppo di istanze gestite specificato. Altrimenti, la creazione la richiesta di ridimensionamento non va a buon fine.

  • COUNT: il numero di VM da aggiungere contemporaneamente alla gruppo di istanze gestite

  • RUN_DURATION: la durata, in secondi, della durata ha richiesto l'esecuzione delle VM. Il valore deve essere compreso tra 600, ovvero 600 secondi (10 minuti) e 604800, che corrisponde a 604.800 secondi (7 giorni).

Passaggi successivi