Un gruppo di istanze gestite è un gruppo di istanze di macchine virtuali (VM) che consideri come una singola entità. Ogni VM in un gruppo di istanze gestite si basa su un modello di istanza.
Se devi solo creare più VM, ma non vuoi che siano raggruppate in un gruppo di istanze gestite, consulta l'API delle istanze collettive.
Per saperne di più sulle altre opzioni di Compute Engine, vedi Scegliere una strategia di deployment di Compute Engine per il tuo carico di lavoro.
Per iniziare a creare un gruppo di istanze gestite, leggi questo documento per trovare una configurazione di base adatta a te.
Scenari di base per la creazione di un gruppo di istanze gestite
I gruppi di istanze gestite hanno molte opzioni di configurazione. Consulta le seguenti guide per configurare rapidamente un gruppo di istanze gestite per vari scenari:
Guida | Scenario |
---|---|
Crea un gruppo di istanze gestite con VM in una zona singola (gruppo di istanze gestite a livello di zona) | Il deployment delle VM può essere eseguito in una singola zona. |
Crea un gruppo di istanze gestite con VM in più zone in una regione (gruppo di istanze gestite a livello di regione) | Vuoi distribuire le tue VM tra più zone in una regione per proteggerti da errori a livello di zona o per trovare automaticamente zone con risorse limitate come le VM spot. |
Crea un gruppo di istanze gestite da una VM esistente | Vuoi fare lo scale out di una VM in un gruppo di VM ed eseguirne il deployment in un'unica zona o in più zone. |
Crea un gruppo di istanze gestite con scalabilità automatica | Vuoi che il gruppo di istanze gestite crei automaticamente VM nel gruppo quando la domanda aumenta ed elimini le VM quando la domanda diminuisce. |
Crea un gruppo di istanze gestite che utilizza VM prerilasciabili | Il carico di lavoro può tollerare le interruzioni e vuoi sfruttare i risparmi sui costi associati alle VM prerilasciabili. |
Crea un gruppo di istanze gestite con VM GPU | Il tuo carico di lavoro richiede un gruppo di VM GPU tutte insieme, ad esempio vuoi eseguire carichi di lavoro batch, come l'addestramento di modelli di machine learning o carichi di lavoro per computing ad alte prestazioni, sulle VM GPU. |
Crea un gruppo di istanze gestite con configurazione stateful | Il carico di lavoro richiede una configurazione stateful, ad esempio i dischi che devono conservare i dati ogni volta che le VM vengono riparate automaticamente, aggiornate o ricreate. |
Limitazioni
I gruppi di istanze gestite hanno limitazioni diverse a seconda delle funzionalità utilizzate. I seguenti elenchi mostrano limitazioni generali dei gruppi di istanze gestite e limitazioni aggiuntive se utilizzi funzionalità regionali o stateful.
Per impostazione predefinita, puoi creare fino a 1000 VM in un gruppo di istanze gestite a livello di zona. Se te ne occorrono altri, utilizza una delle seguenti opzioni:
- Aumenta il limite di dimensioni del gruppo di istanze gestite.
- Crea un gruppo di istanze gestite a livello di regione, che consente il doppio delle VM rispetto a un gruppo di istanze gestite a livello di zona.
- Crea più gruppi di istanze gestite e suddividi il carico di lavoro tra loro.
- Contatta l'assistenza per inviare una richiesta.
Quando aggiorni un gruppo di istanze gestite, puoi specificare fino a 1000 VM in una singola richiesta.
Una volta creato il gruppo di istanze gestite, non puoi modificarne le reti o le subnet. Tutte le VM nel gruppo di istanze gestite sono assegnate alle stesse subnet.
Il VPC condiviso su interfacce diverse da
nic0
per i gruppi di istanze gestite è supportato in gcloud CLI e nell'API, ma non nella console Google Cloud.
Un gruppo di istanze gestite distribuito in più zone (un gruppo di istanze gestite a livello di regione) ha le seguenti limitazioni:
- Per impostazione predefinita, puoi creare fino a 2000 VM. Se hai bisogno di un numero maggiore, aumenta il limite delle dimensioni del gruppo di istanze gestite o contatta l'assistenza.
- Devi selezionare le zone associate a un gruppo di istanze gestite a livello di regione quando crei il gruppo di istanze gestite. Dopo aver scelto zone specifiche durante la creazione, non puoi modificarle o aggiornarle in seguito. Tuttavia, puoi impostare la forma di distribuzione di destinazione del gruppo di istanze gestite per specificare in che modo il gruppo distribuisce le proprie istanze gestite nelle zone selezionate.
Se imposti la forma di distribuzione di destinazione del gruppo su
BALANCED
,ANY
oANY_SINGLE_ZONE
, esamina le limitazioni della forma di distribuzione di destinazione.- Se vuoi scalare automaticamente un gruppo di istanze gestite a livello di regione, devi impostare la
forma di distribuzione di destinazione del gruppo su
BALANCED
([Anteprima](/products/#product-launch-stages)) oEVEN
. Se vuoi utilizzare il bilanciamento del carico con un gruppo di istanze gestite a livello di regione, si applicano le seguenti limitazioni:
- Non puoi utilizzare la modalità di bilanciamento di
maxRate
. - Se utilizzi uno schema di bilanciamento del carico HTTP(S) con un gruppo di istanze gestite a livello di regione, devi scegliere la modalità di bilanciamento di
maxRatePerInstance
omaxUtilization
.
- Non puoi utilizzare la modalità di bilanciamento di
Un gruppo di istanze gestite con configurazione stateful, ovvero un gruppo di istanze gestite, ha le seguenti limitazioni:
- Non puoi utilizzare la scalabilità automatica se il gruppo di istanze gestite ha una configurazione stateful.
- Se vuoi utilizzare aggiornamenti in sequenza automatici, devi impostare il metodo di sostituzione su
RECREATE
. - Per i MIG a livello di regione stateful, devi disabilitare la ridistribuzione proattiva (imposta il tipo di ridistribuzione su
NONE
) per impedire l'eliminazione delle istanze stateful tramite la ridistribuzione automatica tra zone. - Se utilizzi una configurazione per tutte le istanze per eseguire l'override delle proprietà del modello di istanza, non puoi specificare queste proprietà in nessuna configurazione per istanza e contemporaneamente nella configurazione di tutte le istanze del gruppo.
Se vuoi configurare un gestore della scalabilità automatica per il tuo gruppo di istanze gestite, consulta anche le specifiche del gestore della scalabilità automatica.
Supporto IPv6
Se vuoi che il gruppo di istanze gestite includa le istanze VM che utilizzano gli indirizzi IPv6, devi utilizzare l'impostazione di doppio stack quando crei il modello di istanza. Per saperne di più, consulta Creare un modello di istanza con indirizzi IPv6.
Attività di gruppo di istanze gestite aggiuntive
Dopo aver creato un gruppo di istanze gestite, potresti voler procedere come segue:
Scopri di più sul gruppo e sulle relative VM
- Visualizza informazioni sul tuo gruppo di istanze gestite e sulle sue istanze VM gestite
- Scopri che cos'è un'istanza gestita e come utilizzare le istanze gestite
Ridimensiona il gruppo
Aggiungi o rimuovi VM dal gruppo
- Ridimensiona automaticamente un gruppo di istanze gestite in base agli aumenti o alle riduzioni del carico configurando un gestore della scalabilità automatica
- Imposta manualmente le dimensioni di un gruppo di istanze gestite
- Disattivare la modalità dei nuovi tentativi di creazione durante il ridimensionamento
- Crea istanze con nomi specifici in un gruppo di istanze gestite
- Eliminare istanze specifiche da un gruppo
- Abbandonare le istanze da un gruppo
Modifica la configurazione VM del gruppo
Applica gli aggiornamenti della configurazione alle VM in un gruppo di istanze gestite
Scopri come aggiungere la configurazione stateful per conservare dischi, indirizzi IP e metadati quando le VM vengono ricreate
Aggiungi funzionalità MIG
- Configura un controllo di integrità basato sull'applicazione per ricreare automaticamente le VM se l'applicazione non risponde come previsto
- Configura un bilanciatore del carico per distribuire il traffico degli utenti su più istanze della tua applicazione.
Tutorial
Prova un tutorial:
- Utilizza la riparazione automatica per le applicazioni ad alta disponibilità
- Utilizza il bilanciamento del carico per applicazioni ad alta disponibilità
- Utilizza la scalabilità automatica per applicazioni a scalabilità elevata
- Migrazione di un carico di lavoro esistente a un gruppo di istanze gestite stateful