Crea una VM che utilizza il modello con prenotazione

Questo documento spiega come creare un'istanza di macchina virtuale (VM) autonoma utilizzando il modello di provisioning vincolato alla prenotazione. Questo modello di provisioning ti consente di creare VM A4X, A4 o A3 Ultra utilizzando la capacità prenotata in anticipo.

Per altri metodi di creazione di VM utilizzando il modello di provisioning con prenotazione, consulta Panoramica delle opzioni di deployment nella documentazione di AI Hypercomputer.

Prima di iniziare

  • Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione verifica la tua identità per l'accesso a Google Cloud servizi e API. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il seguente comando:

      gcloud init

      Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

    2. Set a default region and zone.

    REST

    Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali che fornisci a gcloud CLI.

      Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il seguente comando:

      gcloud init

      Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

    Per saperne di più, consulta Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud .

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare VM utilizzando il modello di provisioning vincolato alla prenotazione, chiedi all'amministratore di concederti il ruolo IAM Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene le autorizzazioni necessarie per creare VM utilizzando il modello di provisioning vincolato alla prenotazione. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per creare VM utilizzando il modello di provisioning con prenotazione, sono necessarie le seguenti autorizzazioni:

  • compute.instances.create sul progetto
  • Per utilizzare un'immagine personalizzata per creare la VM: compute.images.useReadOnly sull'immagine
  • Per utilizzare uno snapshot per creare la VM: compute.snapshots.useReadOnly sullo snapshot
  • Per utilizzare un template di istanza per creare la VM: compute.instanceTemplates.useReadOnly sul template di istanza
  • Per specificare una subnet per la VM: compute.subnetworks.use sul progetto o sulla subnet scelta
  • Per specificare un indirizzo IP statico per la VM: compute.addresses.use sul progetto
  • Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete VPC: compute.subnetworks.useExternalIp sul progetto o sulla subnet scelta
  • Per assegnare una rete legacy alla VM: compute.networks.use sul progetto
  • Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete legacy: compute.networks.useExternalIp sul progetto
  • Per impostare i metadati dell'istanza VM per la VM: compute.instances.setMetadata sul progetto
  • Per impostare i tag per la VM: compute.instances.setTags sulla VM
  • Per impostare le etichette per la VM: compute.instances.setLabels sulla VM
  • Per impostare un service account che la VM possa utilizzare: compute.instances.setServiceAccount sulla VM
  • Per creare un nuovo disco per la VM: compute.disks.create sul progetto
  • Per collegare un disco esistente in modalità di sola lettura o di lettura e scrittura: compute.disks.use sul disco
  • Per collegare un disco esistente in modalità di sola lettura: compute.disks.useReadOnly sul disco

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Crea una VM che utilizza il modello di provisioning con prenotazione

Per creare una VM A4X, A4 o A3 Ultra utilizzando il modello di provisioning con prenotazione, devi attendere che la prenotazione automatica che vuoi utilizzare raggiunga l'ora di inizio. Inoltre, la VM che intendi creare deve soddisfare tutti i seguenti requisiti:

Il seguente esempio crea una richiesta di prenotazione futura in modalità calendario per cinque VM A3 Ultra, quindi crea una VM A3 Ultra utilizzando la prenotazione creata automaticamente per la richiesta.

Per creare una VM di esempio utilizzando il modello di provisioning vincolato alla prenotazione, seleziona una delle seguenti opzioni:

Console

  1. Crea una richiesta di esempio per cinque VM A3 Ultra e inviala per la revisione:

    1. Nella console Google Cloud , vai alla pagina Prenotazioni.

      Vai a Prenotazioni

    2. Fai clic sulla scheda Prenotazioni future.

    3. Fai clic su Crea prenotazione futura. Viene visualizzata la pagina Crea una prenotazione futura.

    4. Nella sezione Configurazione hardware, seleziona Specifica il tipo di macchina, quindi specifica un'istanza A3 Ultra.

    5. Nella sezione Metodo di ottenimento, completa i seguenti passaggi:

      1. Seleziona Cerca la capacità per un massimo di 90 giorni.

      2. Negli elenchi Regione e Zona, specifica la regione e la zona in cui prenotare le risorse. Per questo esempio, seleziona rispettivamente us-central1 e us-central1-a.

      3. Nel campo Capacità totale necessaria, inserisci 5.

      4. Nella sezione Periodo di prenotazione, specifica il periodo di prenotazione.

    6. Specifica i campi rimanenti e fai clic su Invia.

  2. All'ora di inizio della richiesta, per creare una VM A3 Ultra per utilizzare la prenotazione creata automaticamente di esempio, procedi nel seguente modo:

    1. Nella console Google Cloud , vai alla pagina Crea un'istanza.

      Vai a Crea un'istanza

    2. Nel campo Nome, inserisci un nome per la VM. Per questo esempio, inserisci example-vm.

    3. Specifica la Regione e la Zona in cui vuoi prenotare le risorse. Per questo esempio, seleziona rispettivamente us-central1 e us-central1-a.

    4. Fai clic sulla scheda GPU, quindi seleziona NVIDIA H200 141 GB nell'elenco Tipo di GPU. Questa azione specifica una VM A3 Ultra e imposta il modello di provisioning su Con prenotazione.

    5. Nel menu di navigazione, fai clic su Avanzate.

    6. Nella sezione Prenotazioni, seleziona Scegli una prenotazione, quindi fai clic su Scegli una prenotazione.

    7. Nel riquadro Scegli una prenotazione:

      1. Seleziona una prenotazione specifica. Se vuoi utilizzare una prenotazione condivisa esistente in un altro progetto, seleziona il progetto che include la prenotazione nell'elenco Progetto.

      2. Fai clic su Scegli.

    8. Nella sezione Modello di provisioning, espandi la sezione Impostazioni avanzate del modello di provisioning delle VM.

    9. Nell'elenco Alla terminazione della VM, seleziona Arresta (valore predefinito) o Elimina.

    10. Fai clic su Crea.

gcloud

  1. Per creare una richiesta di esempio per cinque VM A3 Ultra e inviarla per la revisione, utilizza il comando gcloud beta compute future-reservations create:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Supponiamo che Google Cloud approvi la richiesta e Compute Engine crei automaticamente una prenotazione vuota. All'ora di inizio della richiesta, il 5 ottobre 2025, Compute Engine aumenta il numero di VM con GPU prenotate nella prenotazione. Puoi quindi utilizzare la prenotazione.

  2. All'ora di inizio della richiesta, per creare una VM A3 Ultra per utilizzare la prenotazione creata automaticamente di esempio, utilizza il comando gcloud compute instances create con i seguenti flag:

    • Il flag --instance-termination-action.

    • Il flag --provisioning-model impostato su RESERVATION_BOUND.

    • Il flag --reservation.

    • Il flag --reservation-affinity impostato su specific.

    Il comando è simile al seguente. Per i requisiti completi per creare una VM A3 Ultra, consulta Crea un'istanza A3 Ultra o A4.

    gcloud compute instance create example-vm  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    Il comando include i seguenti valori:

    • TERMINATION_ACTION: indica se Compute Engine arresta (STOP) o elimina (DELETE) la VM al termine del periodo di prenotazione.

    • RESERVATION_URL: l'URL della prenotazione, che è formattato nel seguente modo:

      • Se la prenotazione creata automaticamente esiste nel tuo progetto: example-reservation.

      • Se la prenotazione creata automaticamente esiste in un progetto diverso: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Per creare una richiesta di esempio per cinque VM A3 Ultra e inviarla per la revisione, invia una richiesta POST al metodo futureReservations.insert beta:

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Supponiamo che Google Cloud approvi la richiesta e Compute Engine crei automaticamente una prenotazione vuota. All'ora di inizio della richiesta, il 5 ottobre 2025, Compute Engine aumenta il numero di VM con GPU prenotate nella prenotazione. Puoi quindi utilizzare la prenotazione.

  2. All'ora di inizio della richiesta, per creare una VM A3 Ultra che utilizzi la prenotazione di esempio creata automaticamente, invia una richiesta POST al metodo instances.insert. Nel corpo della richiesta, includi i seguenti campi:

    • Il campo reservationAffinity.consumeReservationType impostato su SPECIFIC_RESERVATION.

    • Il campo reservationAffinity.key impostato su compute.googleapis.com/reservation-name.

    • Il campo reservationAffinity.values impostato sull'URL della prenotazione.

    • Il campo scheduling.instanceTerminationAction.

    • Il campo scheduling.provisioningModel impostato su RESERVATION_BOUND.

    La richiesta è simile alla seguente. Per i requisiti completi per creare una VM A3 Ultra, consulta Crea un'istanza A3 Ultra o A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-vm",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Il corpo della richiesta include i seguenti valori:

    • RESERVATION_URL: l'URL della prenotazione, che è formattato nel seguente modo:

      • Se la prenotazione creata automaticamente esiste nel tuo progetto: example-reservation.

      • Se la prenotazione creata automaticamente esiste in un progetto diverso: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: indica se Compute Engine arresta (STOP) o elimina (DELETE) la VM al termine del periodo di prenotazione.

Passaggi successivi

Provalo

Se non conosci Google Cloud, crea un account per valutare le prestazioni di Compute Engine in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti per l'esecuzione, il test e il deployment di workload senza costi aggiuntivi.

Fai una prova senza costi di Compute Engine