Crea una VM N1 con GPU collegate


Questo documento spiega come creare una VM con GPU collegate e che utilizza un Famiglia di macchine N1. Puoi utilizzare la maggior parte dei tipi di macchina N1, ad eccezione di N1 shared-core.

Prima di iniziare

  • Per esaminare ulteriori passaggi preliminari, come la selezione di un'immagine del sistema operativo e la verifica della quota GPU, consulta il documento di panoramica.
  • Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione è la procedura mediante la quale la tua identità viene verificata per l'accesso alle API e ai servizi Google Cloud. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine come segue.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Install the Google Cloud CLI, then initialize it by running the following command:

      gcloud init
    2. Set a default region and zone.
    3. REST

      Per utilizzare gli esempi dell'API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali fornite a gcloud CLI.

        Install the Google Cloud CLI, then initialize it by running the following command:

        gcloud init

      Per ulteriori informazioni, vedi Esegui l'autenticazione per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare VM, chiedi all'amministratore di concederti il ruolo IAM Amministratore istanze Compute (v1) (roles/compute.instanceAdmin.v1) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene le autorizzazioni necessarie per creare VM. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:

Autorizzazioni obbligatorie

Per creare le VM sono necessarie le seguenti autorizzazioni:

  • compute.instances.create del progetto
  • Per utilizzare un'immagine personalizzata per creare la VM: compute.images.useReadOnly sull'immagine
  • Per utilizzare uno snapshot per creare la VM: compute.snapshots.useReadOnly sullo snapshot
  • Per utilizzare un modello di istanza per creare la VM: compute.instanceTemplates.useReadOnly nel modello di istanza
  • Per assegnare una rete legacy alla VM: compute.networks.use nel progetto
  • Per specificare un indirizzo IP statico per la VM: compute.addresses.use nel progetto
  • Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete legacy: compute.networks.useExternalIp del progetto
  • Per specificare una subnet per la VM: compute.subnetworks.use nel progetto o nella subnet scelta
  • Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete VPC: compute.subnetworks.useExternalIp nel progetto o nella subnet scelta
  • Per impostare i metadati di un'istanza VM per la VM: compute.instances.setMetadata del progetto
  • Per impostare i tag per la VM: compute.instances.setTags sulla VM
  • Per impostare le etichette per la VM: compute.instances.setLabels sulla VM
  • Per impostare un account di servizio da utilizzare per la VM: compute.instances.setServiceAccount sulla VM
  • Per creare un nuovo disco per la VM: compute.disks.create nel progetto
  • Per collegare un disco esistente in modalità di sola lettura o lettura/scrittura: compute.disks.use sul disco
  • Per collegare un disco esistente in modalità di sola lettura: compute.disks.useReadOnly sul disco

Potresti anche riuscire a ottenere queste autorizzazioni con ruoli personalizzati altri ruoli predefiniti.

Panoramica

I seguenti modelli di GPU possono essere collegati alle VM che utilizzano famiglie di macchine N1.

GPU NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

Workstation virtuale (vWS) NVIDIA RTX (precedentemente nota come NVIDIA GRID):

  • Workstation virtuale NVIDIA T4: nvidia-tesla-t4-vws
  • Workstation virtuale NVIDIA P4: nvidia-tesla-p4-vws
  • Workstation virtuale NVIDIA P100: nvidia-tesla-p100-vws

    Per queste workstation virtuali, viene aggiunta automaticamente alla VM una licenza per workstation virtuale (vWS) NVIDIA RTX.

Crea una VM con GPU collegate

Puoi creare una VM N1 con GPU collegate utilizzando Console Google Cloud, Google Cloud CLI o REST.

Console

  1. Nella console Google Cloud, vai alla pagina Crea un'istanza.

    Vai a Crea un'istanza

  2. Specifica un nome per la VM. Consulta Convenzione di denominazione delle risorse.

  3. Seleziona una regione e una zona in cui sono disponibili le GPU. Consulta l'elenco delle Zone GPU.

  4. Nella sezione Configurazione macchina, seleziona la famiglia di macchine GPU, quindi procedi nel seguente modo:

    1. Nell'elenco Tipo di GPU, seleziona uno dei modelli di GPU supportati. Macchine N1.
    2. Nell'elenco Numero di GPU, seleziona il numero di GPU.
    3. Se il tuo modello di GPU supporta le workstation virtuali (vWS) NVIDIA RTX per i carichi di lavoro grafici e prevedi di eseguire carichi di lavoro ad alta intensità di grafica su questa VM, seleziona Attiva workstation virtuale (NVIDIA GRID).

    4. Nell'elenco Tipo di macchina, seleziona una delle macchine N1 preimpostate di testo. In alternativa, puoi anche specificare impostazioni relative al tipo di macchina personalizzata.

  5. Nella sezione Disco di avvio, fai clic su Cambia. Viene visualizzata la pagina Configurazione disco di avvio.

  6. Nella pagina Configurazione disco di avvio, segui questi passaggi:

    1. Nella scheda Immagini pubbliche, scegli una immagine Compute Engine supportata o Deep Learning VM Images.
    2. Specifica una dimensione del disco di avvio di almeno 40 GB.
    3. Per confermare le opzioni del disco di avvio, fai clic su Seleziona.
  7. (Facoltativo) Configura il modello di provisioning. Ad esempio, se il tuo carico di lavoro è a tolleranza di errore e può essere sottoposto a un possibile prerilascio delle VM, valuta la possibilità di utilizzare le VM spot per ridurre il costo delle VM e delle GPU collegate. Per ulteriori informazioni, consulta GPU su VM spot. A tale scopo, completa i seguenti passaggi:

    1. Nella sezione Criteri di disponibilità, seleziona Spot. dall'elenco Modello di provisioning delle VM. Questa impostazione disattiva le opzioni di riavvio automatico e di manutenzione dell'host per la VM.
    2. (Facoltativo) Nell'elenco Al termine della VM, seleziona cosa succede quando Compute Engine esegue la preemption della VM:
      • Per arrestare la VM durante la preemption, seleziona Interrompi (predefinito).
      • Per eliminare la VM durante il prerilascio, seleziona Elimina.
  8. Per creare e avviare la VM, fai clic su Crea.

gcloud

Per creare e avviare una VM, utilizza gcloud compute instances create con i seguenti flag.

Se il tuo carico di lavoro è a tolleranza di errore e può resistere a un possibile prerilascio delle VM, valuta la possibilità di utilizzare le VM spot per ridurre il costo delle VM e delle GPU collegate. Per ulteriori informazioni, consulta GPU su VM spot. --provisioning-model=SPOT è un flag facoltativo che configura le VM come VM Spot. Per le VM spot, i flag di riavvio automatico e delle opzioni di manutenzione dell'host sono disattivati.

gcloud compute instances create VM_NAME \
    --machine-type MACHINE_TYPE \
    --zone ZONE \
    --boot-disk-size DISK_SIZE \
    --accelerator type=ACCELERATOR_TYPE,count=ACCELERATOR_COUNT \
    [--image IMAGE | --image-family IMAGE_FAMILY] \
    --image-project IMAGE_PROJECT \
    --maintenance-policy TERMINATE \
    [--provisioning-model=SPOT]

Sostituisci quanto segue:

  • VM_NAME: il nome per la nuova VM.
  • MACHINE_TYPE: il tipo di macchina selezionato per la VM.
  • ZONE: la zona per il VM. Questa zona deve supportare il tipo di GPU.
  • DISK_SIZE: le dimensioni del disco di avvio in GB. Specifica una dimensione del disco di avvio di almeno 40 GB.
  • IMAGE o IMAGE_FAMILY che supporta le GPU. Specifica una delle seguenti opzioni:

    • IMAGE: la versione richiesta di un'immagine pubblica. Ad esempio, --image debian-10-buster-v20200309.
    • IMAGE_FAMILY: un famiglia di immagini. Questo crea la VM dall'immagine del sistema operativo più recente e non deprecata. Ad esempio, se specifichi --image-family debian-10, Compute Engine crea una VM dalla versione più recente dell'immagine del sistema operativo nella famiglia di immagini Debian 10.

    Puoi anche specificare un'immagine personalizzata o Deep Learning VM Images.

  • IMAGE_PROJECT: il progetto immagine di Compute Engine a cui appartiene la famiglia di immagini. Se utilizzi un'immagine personalizzata Deep Learning VM Images, specifica il progetto a cui appartengono le immagini.

  • ACCELERATOR_COUNT: il numero di GPU da aggiungere alla VM. Consulta: GPU su Compute Engine per un elenco dei limiti di GPU in base al tipo di macchina della VM.

  • ACCELERATOR_TYPE: il modello GPU che vuoi utilizzare. Se prevedi di eseguire carichi di lavoro con uso intensivo di risorse grafiche su questa VM, utilizza uno dei modelli di workstation virtuale.

    Scegli uno dei seguenti valori:

    • GPU NVIDIA:

      • NVIDIA T4: nvidia-tesla-t4
      • NVIDIA P4: nvidia-tesla-p4
      • NVIDIA P100: nvidia-tesla-p100
      • NVIDIA V100: nvidia-tesla-v100
    • Workstation virtuale (vWS) NVIDIA RTX (precedentemente nota come NVIDIA GRID):

      • Workstation virtuale NVIDIA T4: nvidia-tesla-t4-vws
      • Workstation virtuale NVIDIA P4: nvidia-tesla-p4-vws
      • Workstation virtuale NVIDIA P100: nvidia-tesla-p100-vws

        Per queste workstation virtuali, alla VM viene aggiunta automaticamente una licenza per workstation virtuale (vWS) NVIDIA RTX.

Esempio

Ad esempio, puoi utilizzare il seguente comando gcloud per avviare un VM Ubuntu 22.04 con 1 GPU NVIDIA T4 e 2 vCPU us-east1-d zona.

gcloud compute instances create gpu-instance-1 \
    --machine-type n1-standard-2 \
    --zone us-east1-d \
    --boot-disk-size 40GB \
    --accelerator type=nvidia-tesla-t4,count=1 \
    --image-family ubuntu-2204-lts \
    --image-project ubuntu-os-cloud \
    --maintenance-policy TERMINATE

REST

Identifica il tipo di GPU che vuoi aggiungere alla VM. Invia una richiesta GET per elencare i tipi di GPU disponibili per il tuo progetto in una zona specifica.

Se il carico di lavoro è a tolleranza di errore ed è in grado di resistere con il prerilascio delle VM, valuta la possibilità di utilizzare le VM spot per ridurre il costo alle VM e alle GPU collegate. Per ulteriori informazioni, consulta GPU su VM spot. "provisioningModel": "SPOT" è un parametro facoltativo che configura le tue VM come VM spot. Per le VM spot, il riavvio automatico e i flag delle opzioni di manutenzione dell'host sono disabilitati.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes

Sostituisci quanto segue:

  • PROJECT_ID: ID progetto.
  • ZONE: zona da cui vuoi elencare i tipi di GPU disponibili.

Invia una richiesta POST al metodo instances.insert. Includi il parametro acceleratorType per specificare il tipo di GPU che vuoi utilizzare. includi il parametro acceleratorCount per specificare il numero di GPU che vuoi da aggiungere. Imposta anche il parametro onHostMaintenance su TERMINATE.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "disks":
  [
    {
      "type": "PERSISTENT",
      "initializeParams":
      {
        "diskSizeGb": "DISK_SIZE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "boot": true
    }
  ],
  "name": "VM_NAME",
  "networkInterfaces":
  [
    {
      "network": "projects/PROJECT_ID/global/networks/NETWORK"
    }
  ],
  "guestAccelerators":
  [
    {
      "acceleratorCount": ACCELERATOR_COUNT,
      "acceleratorType": "projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
    }
  ],
  "scheduling":
  {
    ["automaticRestart": true],
    "onHostMaintenance": "TERMINATE",
    ["provisioningModel": "SPOT"]
  },
}

Sostituisci quanto segue:

  • VM_NAME: il nome della VM.
  • PROJECT_ID: il tuo ID progetto.
  • ZONE: la zona per il VM. Questa zona deve supportare Tipo di GPU.
  • MACHINE_TYPE: il tipo di macchina selezionato per la VM. Consulta la sezione GPU su Compute Engine per scoprire quali tipi di macchine sono disponibili in base al numero di GPU che ti interessa.
  • IMAGE o IMAGE_FAMILY: specifica una delle seguenti opzioni:

    • IMAGE: la versione richiesta di un immagine pubblica. Ad esempio: "sourceImage": "projects/debian-cloud/global/images/debian-10-buster-v20200309"
    • IMAGE_FAMILY: un famiglia di immagini. In questo modo viene creata la VM dall'immagine del sistema operativo più recente e non ritirata. Per Ad esempio, se specifichi "sourceImage": "projects/debian-cloud/global/images/family/debian-10", Compute Engine crea una VM dalla versione più recente dell'immagine sistema operativo nella famiglia di immagini Debian 10.

    Puoi anche specificare un'immagine personalizzata o Deep Learning VM Image.

  • IMAGE_PROJECT: il Progetto immagine di Compute Engine a cui appartiene la famiglia di immagini. Se utilizzi un'immagine personalizzata Deep Learning VM Images, specifica il progetto a cui appartengono le immagini.

  • DISK_SIZE: le dimensioni del disco di avvio in GB. Specifica una dimensione del disco di avvio di almeno 40 GB.

  • NETWORK: la rete VPC che vuoi utilizzare per la VM. Puoi specificare default per utilizzare la rete predefinita.

  • ACCELERATOR_COUNT: il numero di GPU che vuoi aggiungere alla VM. Consulta: GPU su Compute Engine per un elenco dei limiti di GPU in base al tipo di macchina della VM.

  • ACCELERATOR_TYPE: il modello GPU che vuoi utilizzare. Se prevedi di eseguire carichi di lavoro con uso intensivo di risorse grafiche su questa VM, utilizza uno dei modelli di workstation virtuale.

    Scegli uno dei seguenti valori:

    • GPU NVIDIA:

      • NVIDIA T4: nvidia-tesla-t4
      • NVIDIA P4: nvidia-tesla-p4
      • NVIDIA P100: nvidia-tesla-p100
      • NVIDIA V100: nvidia-tesla-v100
    • Workstation virtuale (vWS) NVIDIA RTX (precedentemente nota come NVIDIA GRID):

      • Workstation virtuale NVIDIA T4: nvidia-tesla-t4-vws
      • Workstation virtuale NVIDIA P4: nvidia-tesla-p4-vws
      • Workstation virtuale NVIDIA P100: nvidia-tesla-p100-vws

        Per queste workstation virtuali, alla VM viene aggiunta automaticamente una licenza per workstation virtuale (vWS) NVIDIA RTX.

Installa i driver

Per installare i driver, scegli una delle seguenti opzioni:

Passaggi successivi