Questo documento descrive il funzionamento delle richieste di ridimensionamento in un gruppo di istanze gestite (MIG) e le relative limitazioni. Utilizza le richieste di ridimensionamento per creare contemporaneamente istanze di macchine virtuali (VM) con GPU in un gruppo di istanze gestite.
La creazione di VM contemporaneamente in un gruppo di istanze gestite tramite una richiesta di ridimensionamento è utile nei seguenti scenari:
Se vuoi che le VM GPU siano disponibili solo per un periodo di tempo specifico, la richiesta di ridimensionamento aumenta le possibilità di ottenere GPU, che sono risorse molto richieste.
Quando vuoi un numero esatto di VM per eseguire un job, una richiesta di ridimensionamento ti aiuta a creare tutte le VM contemporaneamente. Utilizzando le richieste di ridimensionamento, puoi anche evitare addebiti non necessari per la capacità parziale creata da Compute Engine mentre aspetti che tutte le risorse siano disponibili.
Come funzionano le richieste di ridimensionamento
Quando crei una richiesta di ridimensionamento, devi specificare quanto segue:
resizeBy
: il numero di VM che vuoi creare contemporaneamente nell'ambito della richiesta.requestedRunDuration
: la durata per cui le VM sono state create come parte della richiesta. La durata dell'esecuzione deve essere compresa tra 10 minuti e 7 giorni. Al termine della durata dell'esecuzione, il gruppo di istanze gestite elimina le VM create.
Quando crei una richiesta di ridimensionamento in un gruppo di istanze gestite, Compute Engine imposta lo stato
della richiesta a CREATING
, per poi eseguirne la transizione a ACCEPTED
quando
viene creata una richiesta specifica. Dynamic Workload Scheduler (DWS),
il meccanismo di pianificazione sottostante, pianifica le richieste di ridimensionamento create su
Compute Engine in base alle durate richieste e alla disponibilità delle risorse.
Dopo che il DWS ha pianificato la creazione del numero richiesto di VM, il gruppo di istanze gestite aumenta la dimensione target in base al numero di VM richieste e crea istanze gestite con stato CREATING
. Queste istanze gestite rappresentano le VM
che il gruppo di istanze gestite creerà quando la richiesta di ridimensionamento avrà esito positivo. Non puoi eliminare
istanze gestite in stato CREATING
a meno che non annulli il ridimensionamento
richiesta.
Se non disponi della quota per le risorse richieste o se le risorse non sono temporaneamente disponibili, DWS mantiene la richiesta fino a quando non avrai una quota sufficiente e le risorse non saranno disponibili.
Una richiesta di ridimensionamento accettata rimane tale finché Compute Engine non imposta la sua uno dei seguenti stati:
SUCCEEDED
: il gruppo di istanze gestite ha creato contemporaneamente il numero richiesto di VM. Le VM vengono eseguite fino a quando il gruppo di istanze gestite non le elimina al termine della durata di esecuzione specificata o fino a quando non le elimini.FAILED
: la richiesta di ridimensionamento non è riuscita a causa di un errore tecnico. Compute Engine ha ridotto la dimensione target del gruppo di istanze gestite del numero di VM richieste.CANCELLED
: un utente ha annullato la richiesta di ridimensionamento e Compute Engine ha ridotto la dimensione target del gruppo di istanze gestite in base al numero di VM richieste. Se vuoi interrompere la creazione di VM per una richiesta di ridimensionamento accettata, devi annullare la richiesta di ridimensionamento, quindi puoi eventualmente eliminarla. Se non elimini un ridimensionamento annullato richiesta, Compute Engine la elimina automaticamente 14 giorni dopo annullato.
Per controllare lo stato di una richiesta di ridimensionamento accettata o per risolverne i problemi, visualizza i dettagli della richiesta di ridimensionamento.
Se elimini un gruppo di istanze gestite contenente richieste di ridimensionamento, questa operazione elimina anche qualsiasi
richieste di ridimensionamento e VM
nel gruppo di istanze gestite. Tuttavia, se elimini un gruppo di istanze gestite quando questo è in fase di creazione di VM per soddisfare una richiesta di ridimensionamento, Compute Engine attende il completamento della creazione del numero richiesto di VM e il passaggio dello stato della richiesta di ridimensionamento a SUCCEEDED
prima di eliminare il gruppo di istanze gestite.
Limitazioni
Le seguenti sezioni descrivono i limiti della creazione di richieste di ridimensionamento in un gruppo di istanze gestite
Limitazioni per le richieste di ridimensionamento
Per le richieste di ridimensionamento, si applicano le seguenti limitazioni:
Puoi utilizzare la richiesta di ridimensionamento solo per ottenere VM GPU.
Puoi creare una richiesta di ridimensionamento solo nei gruppi di istanze gestite zonali.
Puoi annullare solo le richieste di ridimensionamento accettate (
ACCEPTED
).Puoi eliminare una richiesta di ridimensionamento solo dopo che è andata a buon fine (
SUCCEEDED
), non è andata a buon fine (FAILED
) o è stata annullata da un utente (CANCELLED
).
Limitazioni per il modello di istanza
Per il modello di istanza utilizzato nel gruppo di istanze gestite in cui vuoi creare richieste di ridimensionamento, si applicano le seguenti limitazioni:
Devi specificare di arrestare le VM durante ospitare eventi di manutenzione.
Devi specificare di non utilizzare prenotazioni.
Non puoi specificare le VM spot.
Non puoi specificare criteri di posizionamento.
Non puoi specificare
maxRunDuration
oppureterminationTime
campi.
Limitazioni per il gruppo di istanze gestite
Per il gruppo di istanze gestite in cui vuoi creare richieste di ridimensionamento, si applicano i seguenti limiti:
Devi disattivare le riparazioni nel gruppo di istanze gestite.
Devi eliminare la configurazione della scalabilità automatica.
Non puoi applicare aggiornamenti alla configurazione delle VM create tramite richieste di ridimensionamento. Per impedire gli aggiornamenti automatici, imposta il tipo di aggiornamento del gruppo di istanze gestite su opportunistico.
Non puoi applicare il metodo configurazione di tutte le istanze per VM create tramite richieste di ridimensionamento.
Non puoi definire configurazioni per istanza nelle VM create tramite richieste di ridimensionamento.
Puoi impostare la modalità pool di standby del MIG solo su
manual
(predefinito).Se un gruppo di istanze gestite contiene richieste di ridimensionamento accettate, non puoi:
Non puoi aggiungere un secondo modello di istanza per avviare un aggiornamento canary nel gruppo di istanze gestite.
Non puoi modificare dimensione target del gruppo di istanze gestite.
Non puoi eliminare o abbandonare le istanze gestite in uno stato
CREATING
creato dal gruppo di istanze gestite per una richiesta di ridimensionamento. Per eliminare queste istanze gestite, devi annullare la richiesta di ridimensionamento.Non puoi ricreare, sospendere o arrestare una VM creata tramite una richiesta di ridimensionamento.
Quota per le VM GPU con durata di esecuzione richiesta
VM GPU configurate per l'eliminazione automatica dopo un tempo di esecuzione predefinito di massimo 7 giorni, possono utilizzare quote di allocazione standard. Questo comportamento è previsto per aiutarti a migliorare l'ottenimento di una quota di allocazione per carichi di lavoro temporanei ma senza interruzioni. Per ulteriori informazioni al riguardo, il comportamento degli utenti, consulta VM GPU e quote di allocazione prerilasciabili.Prezzi
Non sono previsti costi associati alla creazione, all'annullamento o all'eliminazione del ridimensionamento richieste. Ti vengono addebitati dei costi solo per le VM create tramite un ridimensionamento richiesta, dal momento in cui il gruppo di istanze gestite crea le VM fino a quando il gruppo di istanze gestite elimina automaticamente le VM alla fine della loro durata di esecuzione o manualmente per eliminare le VM.
Se un gruppo di istanze gestite crea solo alcune delle VM richieste e non riesce a creare le VM rimanenti, potresti comunque incorrere in addebiti per le VM create finché Il gruppo di istanze gestite li elimina automaticamente.
Passaggi successivi
Scopri come creare richieste di ridimensionamento in un gruppo di istanze gestite.
Scopri come visualizzare, annullare o eliminare le richieste di ridimensionamento in un gruppo di istanze gestite.