Questo documento spiega come creare un'istanza di macchina virtuale (VM) autonoma utilizzando il modello di provisioning vincolato alla prenotazione. Questo modello di provisioning ti consente di creare VM A4X, A4 o A3 Ultra utilizzando la capacità prenotata in anticipo.
Per altri metodi di creazione di VM utilizzando il modello di provisioning con prenotazione, consulta Panoramica delle opzioni di deployment nella documentazione di AI Hypercomputer.
Prima di iniziare
-
Se non l'hai ancora fatto, configura l'autenticazione.
L'autenticazione verifica la tua identità per l'accesso a Google Cloud servizi e API. Per eseguire
codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su
Compute Engine selezionando una delle seguenti opzioni:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il seguente comando:
gcloud init
Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
- Set a default region and zone.
REST
Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali che fornisci a gcloud CLI.
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il seguente comando:
gcloud init
Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
Per saperne di più, consulta Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud .
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare VM utilizzando il modello di provisioning vincolato alla prenotazione, chiedi all'amministratore di concederti il ruolo IAM Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.Questo ruolo predefinito contiene le autorizzazioni necessarie per creare VM utilizzando il modello di provisioning vincolato alla prenotazione. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per creare VM utilizzando il modello di provisioning con prenotazione, sono necessarie le seguenti autorizzazioni:
-
compute.instances.create
sul progetto -
Per utilizzare un'immagine personalizzata per creare la VM:
compute.images.useReadOnly
sull'immagine -
Per utilizzare uno snapshot per creare la VM:
compute.snapshots.useReadOnly
sullo snapshot -
Per utilizzare un template di istanza per creare la VM:
compute.instanceTemplates.useReadOnly
sul template di istanza -
Per specificare una subnet per la VM:
compute.subnetworks.use
sul progetto o sulla subnet scelta -
Per specificare un indirizzo IP statico per la VM:
compute.addresses.use
sul progetto -
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete VPC:
compute.subnetworks.useExternalIp
sul progetto o sulla subnet scelta -
Per assegnare una rete legacy alla VM:
compute.networks.use
sul progetto -
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete legacy:
compute.networks.useExternalIp
sul progetto -
Per impostare i metadati dell'istanza VM per la VM:
compute.instances.setMetadata
sul progetto -
Per impostare i tag per la VM:
compute.instances.setTags
sulla VM -
Per impostare le etichette per la VM:
compute.instances.setLabels
sulla VM -
Per impostare un service account che la VM possa utilizzare:
compute.instances.setServiceAccount
sulla VM -
Per creare un nuovo disco per la VM:
compute.disks.create
sul progetto -
Per collegare un disco esistente in modalità di sola lettura o di lettura e scrittura:
compute.disks.use
sul disco -
Per collegare un disco esistente in modalità di sola lettura:
compute.disks.useReadOnly
sul disco
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Crea una VM che utilizza il modello di provisioning con prenotazione
Per creare una VM A4X, A4 o A3 Ultra utilizzando il modello di provisioning con prenotazione, devi attendere che la prenotazione automatica che vuoi utilizzare raggiunga l'ora di inizio. Inoltre, la VM che intendi creare deve soddisfare tutti i seguenti requisiti:
La VM e la prenotazione devono avere proprietà corrispondenti.
La VM deve avere come target specifico la prenotazione per l'utilizzo.
La VM deve essere arrestata o eliminata all'ora di fine della prenotazione.
Il seguente esempio crea una richiesta di prenotazione futura in modalità calendario per cinque VM A3 Ultra, quindi crea una VM A3 Ultra utilizzando la prenotazione creata automaticamente per la richiesta.
Per creare una VM di esempio utilizzando il modello di provisioning vincolato alla prenotazione, seleziona una delle seguenti opzioni:
Console
Crea una richiesta di esempio per cinque VM A3 Ultra e inviala per la revisione:
Nella console Google Cloud , vai alla pagina Prenotazioni.
Fai clic sulla scheda Prenotazioni future.
Fai clic su
Crea prenotazione futura. Viene visualizzata la pagina Crea una prenotazione futura.Nella sezione Configurazione hardware, seleziona Specifica il tipo di macchina, quindi specifica un'istanza A3 Ultra.
Nella sezione Metodo di ottenimento, completa i seguenti passaggi:
Seleziona Cerca la capacità per un massimo di 90 giorni.
Negli elenchi Regione e Zona, specifica la regione e la zona in cui prenotare le risorse. Per questo esempio, seleziona rispettivamente us-central1 e us-central1-a.
Nel campo Capacità totale necessaria, inserisci
5
.Nella sezione Periodo di prenotazione, specifica il periodo di prenotazione.
Specifica i campi rimanenti e fai clic su Invia.
All'ora di inizio della richiesta, per creare una VM A3 Ultra per utilizzare la prenotazione creata automaticamente di esempio, procedi nel seguente modo:
Nella console Google Cloud , vai alla pagina Crea un'istanza.
Nel campo Nome, inserisci un nome per la VM. Per questo esempio, inserisci
example-vm
.Specifica la Regione e la Zona in cui vuoi prenotare le risorse. Per questo esempio, seleziona rispettivamente us-central1 e us-central1-a.
Fai clic sulla scheda GPU, quindi seleziona NVIDIA H200 141 GB nell'elenco Tipo di GPU. Questa azione specifica una VM A3 Ultra e imposta il modello di provisioning su Con prenotazione.
Nel menu di navigazione, fai clic su Avanzate.
Nella sezione Prenotazioni, seleziona Scegli una prenotazione, quindi fai clic su Scegli una prenotazione.
Nel riquadro Scegli una prenotazione:
Seleziona una prenotazione specifica. Se vuoi utilizzare una prenotazione condivisa esistente in un altro progetto, seleziona il progetto che include la prenotazione nell'elenco Progetto.
Fai clic su Scegli.
Nella sezione Modello di provisioning, espandi la sezione Impostazioni avanzate del modello di provisioning delle VM.
Nell'elenco Alla terminazione della VM, seleziona Arresta (valore predefinito) o Elimina.
Fai clic su Crea.
gcloud
Per creare una richiesta di esempio per cinque VM A3 Ultra e inviarla per la revisione, utilizza il comando
gcloud beta compute future-reservations create
:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-type=local \ --start-time=2025-10-05T00:00:00Z \ --end-time=2025-10-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-a
Supponiamo che Google Cloud approvi la richiesta e Compute Engine crei automaticamente una prenotazione vuota. All'ora di inizio della richiesta, il 5 ottobre 2025, Compute Engine aumenta il numero di VM con GPU prenotate nella prenotazione. Puoi quindi utilizzare la prenotazione.
All'ora di inizio della richiesta, per creare una VM A3 Ultra per utilizzare la prenotazione creata automaticamente di esempio, utilizza il comando
gcloud compute instances create
con i seguenti flag:Il flag
--instance-termination-action
.Il flag
--provisioning-model
impostato suRESERVATION_BOUND
.Il flag
--reservation
.Il flag
--reservation-affinity
impostato suspecific
.
Il comando è simile al seguente. Per i requisiti completi per creare una VM A3 Ultra, consulta Crea un'istanza A3 Ultra o A4.
gcloud compute instance create example-vm \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-a \ ...
Il comando include i seguenti valori:
TERMINATION_ACTION
: indica se Compute Engine arresta (STOP
) o elimina (DELETE
) la VM al termine del periodo di prenotazione.RESERVATION_URL
: l'URL della prenotazione, che è formattato nel seguente modo:Se la prenotazione creata automaticamente esiste nel tuo progetto:
example-reservation
.Se la prenotazione creata automaticamente esiste in un progetto diverso:
projects/PROJECT_ID/reservations/example-reservation
.
REST
Per creare una richiesta di esempio per cinque VM A3 Ultra e inviarla per la revisione, invia una richiesta
POST
al metodofutureReservations.insert
beta:POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2025-10-05T00:00:00Z", "endTime": "2025-10-19T00:00:00Z" } }
Supponiamo che Google Cloud approvi la richiesta e Compute Engine crei automaticamente una prenotazione vuota. All'ora di inizio della richiesta, il 5 ottobre 2025, Compute Engine aumenta il numero di VM con GPU prenotate nella prenotazione. Puoi quindi utilizzare la prenotazione.
All'ora di inizio della richiesta, per creare una VM A3 Ultra che utilizzi la prenotazione di esempio creata automaticamente, invia una richiesta
POST
al metodoinstances.insert
. Nel corpo della richiesta, includi i seguenti campi:Il campo
reservationAffinity.consumeReservationType
impostato suSPECIFIC_RESERVATION
.Il campo
reservationAffinity.key
impostato sucompute.googleapis.com/reservation-name
.Il campo
reservationAffinity.values
impostato sull'URL della prenotazione.Il campo
scheduling.instanceTerminationAction
.Il campo
scheduling.provisioningModel
impostato suRESERVATION_BOUND
.
La richiesta è simile alla seguente. Per i requisiti completi per creare una VM A3 Ultra, consulta Crea un'istanza A3 Ultra o A4.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances { { "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g", "name": "example-vm", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }
Il corpo della richiesta include i seguenti valori:
RESERVATION_URL
: l'URL della prenotazione, che è formattato nel seguente modo:Se la prenotazione creata automaticamente esiste nel tuo progetto:
example-reservation
.Se la prenotazione creata automaticamente esiste in un progetto diverso:
projects/PROJECT_ID/reservations/example-reservation
.
TERMINATION_ACTION
: indica se Compute Engine arresta (STOP
) o elimina (DELETE
) la VM al termine del periodo di prenotazione.
Passaggi successivi
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Compute Engine in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti per l'esecuzione, il test e il deployment di workload senza costi aggiuntivi.
Fai una prova senza costi di Compute EngineSalvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2025-09-25 UTC.
-