Questo documento descrive il funzionamento delle richieste di ridimensionamento in un gruppo di istanze gestite (MIG) e le relative limitazioni. Utilizza le richieste di ridimensionamento per creare contemporaneamente istanze di macchine virtuali (VM) con GPU in un gruppo di istanze gestite.
La creazione di VM contemporaneamente in un gruppo di istanze gestite tramite una richiesta di ridimensionamento è utile nei seguenti scenari:
Se vuoi VM GPU solo per un periodo di tempo specifico, una richiesta di ridimensionamento aumenta le probabilità di ottenere queste risorse molto richieste.
Quando vuoi un numero esatto di VM per eseguire un job, una richiesta di ridimensionamento ti aiuta a creare tutte le VM contemporaneamente. In questo modo, puoi evitare addebiti non necessari per la capacità parziale creata da Compute Engine mentre aspetti che tutte le risorse diventino disponibili.
Come funzionano le richieste di ridimensionamento
Le sezioni seguenti descrivono il funzionamento delle richieste di ridimensionamento.
Al momento della creazione
Quando crei una richiesta di ridimensionamento, devi specificare le seguenti proprietà:
resizeBy
: il numero di VM che vuoi creare contemporaneamente nell'ambito della richiesta.requestedRunDuration
: la durata per la quale devono essere eseguite le VM create nell'ambito della richiesta. La durata dell'esecuzione deve essere compresa tra 10 minuti e 7 giorni. Al termine della durata dell'esecuzione, il gruppo di istanze gestite elimina automaticamente le VM create.
Dopo la creazione
Dopo aver creato una richiesta di ridimensionamento, Compute Engine ne modifica lo stato come segue:
CREATING
: Compute Engine sta creando la richiesta di ridimensionamento, la dimensione target del gruppo di istanze gestite aumenta del numero di VM specificate nella richiesta e il gruppo di istanze gestite crea istanze gestite in statoCREATING
. Queste istanze gestite rappresentano le VM create dal gruppo di istanze gestite quando la richiesta di ridimensionamento va a buon fine.ACCEPTED
: la richiesta è stata creata e accettata. Il meccanismo di pianificazione di base, Dynamic Workload Scheduler (DWS), pianifica la creazione delle risorse richieste in base alla disponibilità delle risorse e alla durata dell'esecuzione specificata nella richiesta. Se non hai quota sufficiente per le risorse richieste o se le risorse non sono temporaneamente disponibili, DWS mantiene la richiesta fino a quando non avrai quota sufficiente e le risorse non saranno disponibili.SUCCEEDED
: il MIG ha creato contemporaneamente il numero di VM richiesto. Le VM vengono eseguite fino a quando il gruppo di istanze gestite non le elimina al termine della durata di esecuzione specificata o fino a quando non le elimini.FAILED
: la richiesta di ridimensionamento non è riuscita a causa di un errore tecnico e Compute Engine ha ridotto le dimensioni target del MIG in base al numero di VM richieste.CANCELLED
: un utente ha annullato la richiesta di ridimensionamento. L'annullamento di una richiesta di ridimensionamento impedisce al MIG di creare le risorse richieste. Dopo aver annullato una richiesta di ridimensionamento, Compute Engine diminuisce le dimensioni target del gruppo di istanze gestite in base al numero di VM richieste e elimina automaticamente la richiesta dopo 14 giorni. Se vuoi, puoi eliminare una richiesta di ridimensionamento prima che Compute Engine la elimini automaticamente.
Se elimini un gruppo di istanze gestite contenente richieste di ridimensionamento, questa operazione elimina anche tutte le richieste di ridimensionamento e le VM nel gruppo di istanze gestite. Tuttavia, se elimini un gruppo di istanze gestite quando questo sta creando VM per soddisfare una richiesta di ridimensionamento, Compute Engine attende che il gruppo di istanze gestite abbia completato la creazione del numero di VM richiesto e che lo stato della richiesta di ridimensionamento passi a SUCCEEDED
prima di eliminare il gruppo di istanze gestite.
Limitazioni
Le sezioni seguenti illustrano le limitazioni per la creazione di richieste di ridimensionamento in un MIG.
Per le richieste di ridimensionamento
Per le richieste di ridimensionamento si applicano le seguenti limitazioni:
Puoi utilizzare la richiesta di ridimensionamento solo per ottenere VM GPU.
Puoi annullare solo le richieste di ridimensionamento accettate (
ACCEPTED
).Puoi eliminare una richiesta di ridimensionamento solo dopo che è andata a buon fine (
SUCCEEDED
), non è andata a buon fine (FAILED
) o è stata annullata da un utente (CANCELLED
).
Per il modello di istanza
Per il modello di istanza utilizzato nel gruppo di istanze gestite in cui vuoi creare richieste di ridimensionamento, si applicano le seguenti limitazioni:
Devi specificare di arrestare le VM durante gli eventi di manutenzione dell'host.
Devi specificare di non utilizzare prenotazioni.
Non puoi specificare VM spot.
Non puoi specificare criteri di posizionamento.
Non puoi specificare i campi
maxRunDuration
oterminationTime
.
Per il gruppo di istanze gestite
Per il gruppo di istanze gestite in cui vuoi creare richieste di ridimensionamento, si applicano i seguenti limiti:
In un gruppo di istanze gestite a livello di regione, solo la
ANY_SINGLE_ZONE
forma di distribuzione di destinazione supporta la richiesta di ridimensionamento (Anteprima). Le altre forme di distribuzione non sono supportate.Devi disattivare le riparazioni in MIG.
Devi eliminare la configurazione della scalabilità automatica.
Non puoi applicare aggiornamenti alla configurazione delle VM alle VM create tramite richieste di ridimensionamento. Per impedire gli aggiornamenti automatici, imposta il tipo di aggiornamento del gruppo di istanze gestite su opportunistico.
Non puoi applicare la configurazione per tutte le istanze alle VM create tramite richieste di ridimensionamento.
Non puoi definire configurazioni per istanza nelle VM create tramite richieste di ridimensionamento.
Puoi impostare la modalità pool di standby del MIG solo su
manual
(predefinito).Se un gruppo di istanze gestite contiene richieste di ridimensionamento accettate, non puoi:
Non puoi aggiungere un secondo modello di istanza per avviare un aggiornamento canary nel gruppo di istanze gestite.
Non puoi modificare le dimensioni target del gruppo di istanze gestite.
Non puoi eliminare o abbandonare le istanze gestite in uno stato
CREATING
creato dal gruppo di istanze gestite per una richiesta di ridimensionamento. Per eliminare queste istanze gestite, devi annullare la richiesta di ridimensionamento.Non puoi ricreare, sospendere o arrestare una VM creata tramite una richiesta di ridimensionamento.
Quota per le VM GPU con la durata di esecuzione richiesta
Le VM GPU configurate per essere eliminate automaticamente dopo un tempo di esecuzione predefinito di massimo 7 giorni possono consumare quote di allocazione prerilasciabili o standard. Questo comportamento è inteso per aiutarti a migliorare l'ottenibilità della quota di allocazione per carichi di lavoro temporanei, ma ininterrotti. Per ulteriori informazioni su questo comportamento, consulta VM GPU e quote di allocazione prerilasciabili.Prezzi
Non sono previsti costi per la creazione, l'annullamento o l'eliminazione delle richieste di ridimensionamento. Ti vengono addebitati costi solo per le VM create tramite una richiesta di ridimensionamento, dal momento in cui il gruppo di istanze gestite le crea fino a quando non le elimina automaticamente al termine della loro durata di esecuzione o fino a quando non le elimini manualmente.
Se un gruppo di istanze gestite crea solo alcune delle VM richieste e non riesce a crearne altre, potresti comunque incorrere in addebiti per le VM create finché il gruppo di istanze gestite non le elimina automaticamente.
Passaggi successivi
Scopri come creare richieste di ridimensionamento in un gruppo di istanze gestite.
Scopri come visualizzare, annullare o eliminare le richieste di ridimensionamento in un gruppo di istanze gestite.