Questo documento descrive come creare richieste di ridimensionamento in un gruppo di istanze gestite (MIG) di istanze di macchine virtuali (VM) con GPU collegate.
Prima di iniziare
- Esamina come funzionano le richieste di ridimensionamento.
- Per assicurarti di avere una quota GPU sufficiente per le risorse che stai richiedere, controlla la quota GPU.
-
Se non l'hai già fatto, configura l'autenticazione.
Autenticazione è
Il processo di verifica dell'identità per l'accesso ai servizi e alle API di Google Cloud.
Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi eseguire l'autenticazione
Compute Engine come segue.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- Set a default region and zone.
-
Per creare un modello di istanza:
compute.instanceTemplates.create
del progetto -
Per creare un gruppo di istanze gestite a livello di zona:
compute.instanceGroupManagers.create
del progetto -
Per creare richieste di ridimensionamento in un gruppo di istanze gestite:
compute.instanceGroupManagers.update
del progetto Interrompi le VM durante gli eventi di manutenzione dell'host.
Non utilizzare prenotazioni.
Nella console Google Cloud, vai alla pagina Modelli di istanza.
Fai clic su Crea modello istanza.
Nel campo Nome, inserisci un nome per il modello di istanza.
Nella sezione Località, seleziona una delle seguenti opzioni:
Per creare un modello di istanza globale, seleziona Globale (valore predefinito).
Per creare un modello di istanza regionale, seleziona A livello di regione e quindi seleziona la regione in cui vuoi creare l'istanza modello.
Nella sezione Configurazione macchina, segui questi passaggi:
Fai clic sulla scheda GPU.
Nell'elenco Tipo di GPU, seleziona il tipo di GPU.
Nell'elenco Numero di GPU, seleziona il numero di GPU.
(Facoltativo) Se il modello GPU supporta Workstation virtuali (vWS) NVIDIA RTX per carichi di lavoro di grafica e prevedi di eseguire carichi di lavoro ad alta intensità di grafica, seleziona Abilita workstation virtuale (NVIDIA GRID).
Nella sezione Tipo di macchina, seleziona un tipo di macchina.
(Facoltativo) Per modificare il tipo di disco di avvio o l'immagine del valore predefinito, nella sezione Nella sezione Disco di avvio, fai clic su Cambia. Poi segui le istruzioni per cambiare il disco di avvio.
Espandi la sezione Opzioni avanzate e segui questi passaggi:
Espandi la sezione Gestione.
Nell'elenco Prenotazioni, seleziona Non utilizzare.
Fai clic su Crea.
Il flag
--maintenance-policy
impostato suTERMINATE
.Il flag
--reservation-affinity
impostato sunone
.INSTANCE_TEMPLATE_NAME
: il nome del modello di istanza da creare.IMAGE_PROJECT
: il progetto immagine che contiene image; ad esempiodebian-cloud
. Per saperne di più sui progetti di immagini supportati, consulta Immagini pubbliche.IMAGE_FAMILY
oIMAGE
: specificane uno dei seguenti:IMAGE_FAMILY
: un famiglia di immagini. Specifica l'immagine del sistema operativo più recente e non ritirata. Ad esempio, se specifichidebian-10
, l'ultima versione della famiglia di immagini Debian 10 è in uso. Per saperne di più sull'utilizzo delle famiglie di immagini, consulta le best practice per le famiglie di immagini.IMAGE
: una versione specifica dell'immagine del sistema operativo; della ad esempiodebian-10-buster-v20200309
. Se scegli di specificare una versione specifica dell'immagine del sistema operativo, devi sostituire il flag--image-family
con il flag--image
.
MACHINE_TYPE
: un tipo di macchina che supporta le GPU. Se specifica un tipo di macchina N1, quindi includi--accelerator
flag per specificare il numero e il tipo di GPU da collegare alle VM.Imposta il campo
scheduling.onHostMaintenance
suTERMINATE
.Imposta il campo
reservationAffinity.consumeReservationType
suNO_RESERVATION
.PROJECT_ID
: l'ID del progetto in cui creare il modello di istanza.INSTANCE_TEMPLATE_NAME
: il nome dell'istanza un modello da creare.IMAGE_PROJECT
: il progetto immagine che contiene l'immagine, ad esempiodebian-cloud
. Per ulteriori informazioni sui per i progetti immagine supportati, consulta Immagini pubbliche.IMAGE
oIMAGE_FAMILY
: specifica una delle seguenti opzioni:IMAGE
: una versione specifica dell'immagine del sistema operativo; della ad esempiodebian-10-buster-v20200309
.IMAGE_FAMILY
: una famiglia di immagini. Specifica l'immagine del sistema operativo più recente e non ritirata. Ad esempio, se specifichifamily/debian-10
, la versione più recente della famiglia di immagini Debian 10 . Per ulteriori informazioni sull'utilizzo delle famiglie di immagini, consulta Best practice per le famiglie di immagini.
MACHINE_TYPE
: un tipo di macchina supporta le GPU. Se specifichi un tipo di macchina N1, includi il campoguestAccelerators
nel corpo della richiesta per specificare il numero e il tipo di GPU da collegare alle VM.Imposta il tipo di aggiornamento del gruppo di istanze gestite su opportunistico (impostazione predefinita).
Se hai configurato la scalabilità automatica nel gruppo di istanze gestite, eliminare la configurazione della scalabilità automatica.
Nella console Google Cloud, vai alla pagina Gruppi di istanze.
Fai clic su Crea gruppo di istanze.
Si apre la pagina Crea gruppo di istanze.
Nel campo Nome, inserisci un nome per il gruppo di istanze gestite.
Nell'elenco Modello di istanza, seleziona il modello di istanza creato nella sezione precedente. Se selezioni un modello di istanza regionale, l'elenco Regione viene impostato sulla regione del modello di istanza.
Nella sezione Località:
Seleziona Zona singola (impostazione predefinita).
Seleziona la Regione e la Zona del gruppo di istanze gestite.
Per eliminare la configurazione della scalabilità automatica:
Nella sezione Scalabilità automatica, fai clic sull'elenco Modalità di scalabilità automatica. e fai clic su Elimina configurazione scalabilità automatica.
Nella finestra di dialogo di conferma, fai clic su Elimina.
Per disattivare le riparazioni, nella sezione Ciclo di vita dell'istanza VM fai clic sull'icona Azione predefinita in caso di errore, quindi seleziona Nessuna azione.
Esegui una di queste operazioni:
A questo punto, per creare una richiesta di ridimensionamento:
Nel campo Numero di istanze, inserisci il numero di VM che vuoi creare contemporaneamente.
Seleziona Utilizza la richiesta di ridimensionamento per creare tutte le VM contemporaneamente casella di controllo.
Nel campo Durata esecuzione richiesta e nell'elenco Unità, specifica la durata di esecuzione delle VM. La durata deve essere compresa tra 1 ora e 7 giorni.
Altrimenti, nel campo Numero di istanze, inserisci
0
. Puoi in un secondo momento, aggiungi le VM nel gruppo creazione di richieste di ridimensionamento.
Fai clic su Crea.
INSTANCE_GROUP_NAME
: il nome del gruppo di istanze gestite da creare.INSTANCE_TEMPLATE_NAME
: il nome del modello di istanza che hai creato nella sezione precedente.ZONE
: la zona in cui creare il gruppo di istanze gestite.PROJECT_ID
: l'ID del progetto in cui è stata inserita l'istanza che hai creato nella sezione precedente.ZONE
: la zona in cui creare il gruppo di istanze gestite.INSTANCE_TEMPLATE_NAME
: il nome dell'istanza creato nella sezione precedente.INSTANCE_GROUP_NAME
: il nome del gruppo di istanze gestite da creare.Nella console Google Cloud, vai alla pagina Gruppi di istanze.
Nella colonna Nome, fai clic sul nome del gruppo di istanze gestite in cui creare la richiesta di ridimensionamento.
Viene visualizzata la pagina Panoramica del gruppo di istanze gestite.
Nella riga Richieste di ridimensionamento, fai clic su
Modifica richieste di ridimensionamento.Fai clic su
Nuova richiesta di ridimensionamento.Viene visualizzato il riquadro Nuove richieste di ridimensionamento.
Nel campo Nome, inserisci il nome della richiesta di ridimensionamento.
Nel campo Numero di istanze aggiuntive necessarie, inserisci il numero di VM da aggiungere al gruppo di istanze gestite con scalabilità automatica contemporaneamente.
Nei campi Durata esecuzione richiesta e Unità, specifica per l'esecuzione delle VM richieste. La durata deve essere compresa tra 1 ora e 7 giorni.
Fai clic su Crea.
INSTANCE_GROUP_NAME
: il nome di un ambiente di zona esistente Gruppo di istanze gestite configurato per la creazione di richieste di ridimensionamento al suo interno.RESIZE_REQUEST_NAME
: il nome della richiesta di ridimensionamento, che deve essere univoco all'interno del gruppo di istanze gestite specificato. In caso contrario, la creazione della richiesta di ridimensionamento non va a buon fine.COUNT
: il numero di VM da aggiungere al MIG contemporaneamente.RUN_DURATION
: la durata desiderata per le VM richieste eseguire. Il formato del valore deve corrispondere al numero di giorni, ore, minuti o secondi seguiti rispettivamente dad
,h
,m
es
. Per Ad esempio, specifica30m
per 30 minuti o1d2h3m4s
per 1 giorno, 2 ore, 3 minuti e 4 secondi. Il valore deve essere compreso tra 10 minuti e 7 giorni.ZONE
: la zona in cui si trova il gruppo di istanze gestite.PROJECT_ID
: l'ID del progetto in cui è stato specificato Il gruppo di istanze gestite si trova.ZONE
: la zona in cui si trova il gruppo di istanze gestite.INSTANCE_GROUP_NAME
: il nome di un MIG zonale esistente configurato per la creazione di richieste di ridimensionamento.RESIZE_REQUEST_NAME
: il nome della richiesta di ridimensionamento, che deve essere univoco all'interno del gruppo di istanze gestite specificato. In caso contrario, la creazione della richiesta di ridimensionamento non va a buon fine.COUNT
: il numero di VM da aggiungere contemporaneamente alla gruppo di istanze gestiteRUN_DURATION
: la durata, in secondi, della durata ha richiesto l'esecuzione delle VM. Il valore deve essere compreso tra600
, ovvero 600 secondi (10 minuti) e604800
, che corrisponde a 604.800 secondi (7 giorni).Scopri come visualizzare, annullare o eliminare le richieste di ridimensionamento in un gruppo di istanze gestite.
Scopri come visualizzare informazioni su MIG e VM gestite.
REST
Per utilizzare gli esempi dell'API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali fornite a gcloud CLI.
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
Per ulteriori informazioni, vedi Esegui l'autenticazione per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare richieste di ridimensionamento in un gruppo di istanze gestite, chiedi all'amministratore di concederti il ruolo IAM Amministratore istanze Compute (v1) (
roles/compute.instanceAdmin.v1
) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.Questo ruolo predefinito contiene le autorizzazioni necessarie per creare richieste di ridimensionamento in un gruppo di istanze gestite. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:
Autorizzazioni obbligatorie
Per creare richieste di ridimensionamento in un gruppo di istanze gestite, sono necessarie le seguenti autorizzazioni:
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
prepara un gruppo di istanze gestite per le richieste di ridimensionamento
Per creare richieste di ridimensionamento in un gruppo di istanze gestite, devi configurare un modello di istanza e il gruppo di istanze gestite come descritto nelle sezioni seguenti.
Crea un modello di istanza
Se vuoi creare richieste di ridimensionamento in un gruppo di istanze gestite, il gruppo deve utilizzare un modello di istanza con le seguenti configurazioni:
Console
Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite:
gcloud
Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite, utilizza il comando
instance-templates create
con i seguenti flag:Ad esempio, utilizza il seguente comando:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --reservation-affinity=none
Sostituisci quanto segue:
REST
Per creare un modello di istanza configurato per creare richieste di ridimensionamento in un gruppo di istanze gestite, effettua una richiesta
POST
al MetodoinstanceTemplates.insert
. Nel corpo della richiesta:Ad esempio, effettua una richiesta
POST
come segue:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "mode": "READ_WRITE", "type": "PERSISTENT", "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "accessConfigs": [ { "name": "external-IP", "type": "ONE_TO_ONE_NAT" } ], "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "onHostMaintenance": "TERMINATE" } } }
Sostituisci quanto segue:
Per ulteriori informazioni sulla creazione di un modello di istanza, consulta Creare modelli di istanza.
Creare o aggiornare un gruppo di istanze gestite
Dopo aver creato il modello di istanza come descritto nella sezione precedente, utilizzalo per creare un gruppo di istanze gestite come segue o per aggiornarne uno. Inoltre, per preparare il gruppo di istanze gestite per le richieste di ridimensionamento:
Console
Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, segui questi passaggi: seguenti:
gcloud
Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, utilizza il comando
instance-groups managed create
con il flag--default-action-on-vm-failure
impostato sudo_nothing
.gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_NAME \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
Sostituisci quanto segue:
REST
Per creare un gruppo di istanze gestite a livello di zona configurato per la creazione di richieste di ridimensionamento, crea un
POST
richiesta alla MetodoinstanceGroupManagers.insert
. Nel corpo della richiesta, includi il campodefaultActionOnFailure
impostato suDO_NOTHING
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "global/instanceTemplates/INSTANCE_TEMPLATE_NAME" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
Sostituisci quanto segue:
Creare una richiesta di ridimensionamento in un gruppo di istanze gestite
Prima di creare richieste di ridimensionamento, assicurati di avere aver preparato il gruppo di istanze gestite come descritto nella sezione precedente.
Dopo aver creato una richiesta di ridimensionamento e tutte le risorse richieste diventano disponibili, il gruppo di istanze gestite crea contemporaneamente il numero richiesto di VM. Le VM vengono eseguite finché il gruppo di istanze gestite non li elimina al termine della durata dell'esecuzione specificata o finché eliminarle.
Console
Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, segui questi passaggi:
gcloud
Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, utilizza il comando
instance-groups managed resize-requests create
.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --requested-run-duration=RUN_DURATION \ --zone=ZONE
Sostituisci quanto segue:
REST
Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, invia una richiesta
POST
al metodoinstanceGroupManagerResizeRequests.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT, "requestedRunDuration": { "seconds": "RUN_DURATION" } }
Sostituisci quanto segue:
Passaggi successivi
Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2024-10-14 UTC.
-