Gruppi di istanze


Un gruppo di istanze è una raccolta di istanze di macchine virtuali (VM) che puoi utilizzare gestire come una singola entità.

Compute Engine offre due tipi di gruppi di istanze VM, gestiti e non gestiti:

  • I gruppi di istanze gestite (MIG) ti consentono di utilizzare le app e più VM identiche. Puoi rendere i tuoi carichi di lavoro scalabili e disponibili sfruttando i servizi MIG automatizzati, tra cui: scalabilità automatica, riparazione automatica, deployment a livello di regione (più zone) e aggiornamento in corso.
  • I gruppi di istanze non gestite ti consentono di eseguire il bilanciamento del carico in un parco risorse di VM che gestisci autonomamente.

Provalo

Se non hai mai utilizzato Google Cloud, crea un account per valutare in che modo Compute Engine offre prestazioni reali diversi scenari. I nuovi clienti ricevono anche 300 $ di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.

Prova Compute Engine gratuitamente

Gruppi di istanze gestite (MIG)

Utilizza un gruppo di istanze gestite (MIG) per scenari come questi:

  • Carichi di lavoro di gestione stateless, ad esempio il frontend di un sito web
  • Carichi di lavoro di calcolo batch, ad alte prestazioni o ad alto throughput senza stato, come l'elaborazione di immagini da una coda
  • Applicazioni stateful, come database, applicazioni legacy e calcoli batch a lunga esecuzione con checkpoint

Compute Engine mantiene tutti i gruppi di istanze gestite istanze gestite in base alla configurazione specificata modello di istanza e facoltativo configurazione stateful.

Per informazioni su come creare un gruppo di istanze gestite, consulta Creazione di gruppi di istanze gestite.

Vantaggi

I gruppi di istanze gestite offrono i seguenti vantaggi:

  • Alta disponibilità.
    • Riparazione automatica delle VM non riuscite. Se una VM nel gruppo si arresta, gli arresti anomali, vengono prerilasciati (VM spot), o viene eliminato da un'azione non avviata dal gruppo di istanze gestite, il Il gruppo di istanze gestite ricrea automaticamente la VM in base alla sua origine (stesso nome VM, stesso modello) in modo che La VM può riprendere il proprio funzionamento.
    • Riparazione automatica basata sulle applicazioni. Puoi anche configurare basato sull'applicazione, che verifica periodicamente che risponde come previsto su ogni istanza del gruppo di istanze gestite. Se un'applicazione non risponde su una VM, il gruppo di istanze gestite la ricrea automaticamente. Verificare che un'applicazione risponda è meglio sia più precisa rispetto alla semplice verifica che una VM sia attiva e in esecuzione.
    • Copertura regionale (più zone). MIG a livello di regione consentono di distribuire il carico dell'app su più zone. Questo la replica protegge da errori a livello di zona. In questo caso, l'app può continuare a gestire il traffico proveniente dalle istanze in esecuzione nelle zone disponibili rimanenti della stessa regione.
    • Bilanciamento del carico. I gruppi di istanze gestite collaborano con i servizi di bilanciamento del carico per distribuire il traffico su tutte le istanze del gruppo.
  • Scalabilità. Quando le tue app richiedono risorse di calcolo aggiuntive, i gruppi di istanze gestite con scalabilità automatica possono aumentare automaticamente il numero di istanze nel gruppo per soddisfare la domanda. Se la domanda cala, i gruppi di istanze gestite con scalabilità automatica possono ridursi automaticamente per ridurre i costi.
  • Aggiornamenti automatici. Lo strumento di aggiornamento automatico dei gruppi di istanze gestite consente di eseguire in sicurezza il deployment di nuove versioni del software nelle istanze all'interno del gruppo di istanze gestite e supporta una gamma flessibile di scenari di implementazione, come aggiornamenti in sequenza e aggiornamenti canary. Puoi controllare la velocità e l'ambito del deployment, il livello di interruzione del servizio.
  • Supporto per i carichi di lavoro stateful. Puoi utilizzare i MIG per creare deployment ad alta disponibilità e automatizzare il funzionamento di applicazioni con dati o configurazione stateful, come database, server DNS, applicazioni monolitiche legacy o calcoli batch di lunga durata con checkpoint. I gruppi di istanze gestite stateful conservano lo stato univoco di ogni istanza (nome dell'istanza, dischi permanenti collegati e metadati) in caso di eventi di riavvio, ricreazione, riparazione automatica e aggiornamento delle macchine.
  • Crea tutte le VM delle GPU contemporaneamente. Quando hai un job batch, ad esempio un addestramento di IA o ML, che richiede un numero esatto di VM GPU, la creazione di una richiesta di ridimensionamento in un gruppo di istanze gestite può aiutarti a creare le VM contemporaneamente. Puoi specificare la durata per la quale vuoi che le VM vengano eseguite, migliorando così la disponibilità di risorse molto richieste come le GPU.
Usa un gruppo di istanze gestite per creare deployment a disponibilità elevata
            per la distribuzione stateless, le applicazioni stateful o i carichi di lavoro in batch.
Panoramica delle funzionalità MIG e dei carichi di lavoro comuni

Riparazione e riparazione automatica

I gruppi di istanze gestite mantengono l'alta disponibilità delle tue applicazioni, mantenendo proattivamente disponibili le istanze. Un MIG ripara automaticamente le istanze non riuscite ricreate.

Potresti anche riparare le istanze quando un'applicazione si blocca, si arresta in modo anomalo o esaurisce la memoria. La riparazione automatica basata sull'applicazione migliora la disponibilità dell'applicazione facendo affidamento su un indicatore di controllo di integrità che rileva problemi specifici dell'applicazione come blocchi, arresti anomali o sovraccarichi. Se un controllo di integrità determina che su una VM, il gruppo ricrea automaticamente quella VM in esecuzione in un'istanza Compute Engine.

Per saperne di più, consulta Informazioni sulla riparazione delle VM in un gruppo di istanze gestite.

Controllo di integrità

I controlli di integrità utilizzati per monitorare i MIG sono simili controlli di integrità utilizzati per il bilanciamento del carico, con alcune differenze di comportamento. Caricamento del bilanciamento dei controlli di integrità il traffico proveniente da istanze non reattive e verso istanze integre. questi elementi i controlli di integrità non fanno sì che Compute Engine ricrei le istanze. I controlli di integrità dei gruppi di istanze gestite segnalano in modo proattivo l'eliminazione e la creazione di nuove istanze il cui stato diviene UNHEALTHY.

Per la maggior parte degli scenari, utilizza controlli di integrità distinti per il bilanciamento del carico e per la riparazione automatica. I controlli di integrità del bilanciamento del carico possono e devono essere più aggressivi, in quanto determinano se un'istanza riceve traffico utente. Poiché i clienti potrebbero fare affidamento sui tuoi servizi, è importante individuare subito le istanze che non rispondono per poter reindirizzare il traffico all'occorrenza. Nel al contrario, il controllo di integrità per la riparazione automatica fa sì che i MIG sostituire proattivamente le istanze in errore, pertanto questo controllo di integrità dovrebbe essere rispetto a un controllo di integrità del bilanciamento del carico.

Per ulteriori informazioni, vedi Configura un controllo di integrità delle applicazioni e una riparazione automatica.

Gruppi a livello di regione o zona

Puoi creare due tipi di MIG:

Entrambi i tipi offrono tutti i vantaggi dei gruppi di istanze gestite. I gruppi di istanze gestite a livello di regione aggiungono una maggiore disponibilità distribuendo il carico delle applicazioni su in più zone, per proteggere il carico di lavoro da errori a livello di zona. I gruppi di istanze gestite offrono maggiore capacità. Per impostazione predefinita, puoi creare fino a 2000 VM in un un gruppo di istanze gestite a livello di regione e 1000 VM in un gruppo di istanze gestite a livello di zona. Se hai bisogno di più VM, puoi aumentare il limite di dimensioni del tuo gruppo di istanze gestite o contattare l'assistenza.

Bilanciamento del carico

Il bilanciamento del carico di Google Cloud può utilizzare i gruppi di istanze per gestire il traffico. In base al tipo di bilanciatore del carico, scegli, puoi aggiungere un'istanza in un pool di destinazione o a un servizio di backend.

Per ulteriori informazioni, consulta Aggiunta di un gruppo di istanze a un bilanciatore del carico.

Scalabilità automatica

I gruppi di istanze gestite supportano la scalabilità automatica, che aggiunge o rimuove dinamicamente istanze VM dal gruppo in risposta all'aumento o alla diminuzione del carico. Puoi configurare un criterio di scalabilità automatica per specificare come vuoi scalare il gruppo. Nel tuo criterio di scalabilità automatica, puoi impostare uno o più indicatori per scalare il gruppo in base utilizzo della CPU, capacità di bilanciamento del carico, metriche di Cloud Monitoring, per i gruppi di istanze gestite a livello di zona, utilizzando un carico di lavoro basato su code come Pub/Sub.

Per ulteriori informazioni, consulta Gruppi di istanze con scalabilità automatica.

Aggiornamento automatico

Puoi eseguire facilmente e in sicurezza il deployment di nuove versioni del software nelle istanze di un gruppo di istanze gestite. L'implementazione di un aggiornamento avviene automaticamente in base alle tue specifiche: puoi controllare la velocità e l'ambito dell'implementazione dell'aggiornamento per ridurre al minimo le interruzioni dell'applicazione. In via facoltativa, eseguire implementazioni parziali, il che consente i test canary.

Consulta Aggiornamento dei gruppi di istanze gestite.

Supporto per i carichi di lavoro stateful

Puoi creare deployment ad alta disponibilità di carichi di lavoro stateful su VM utilizzando gruppi di istanze gestite stateful (stateful MIG). I carichi di lavoro stateful includono applicazioni con dati o configurazione stateful, come database, applicazioni monolitiche legacy e calcoli batch a lunga esecuzione con checkpointing.

Puoi migliorare l'uptime e la resilienza di queste applicazioni con la riparazione automatica, gli aggiornamenti controllati e i deployment multizona, preservando al contempo lo stato univoco di ogni istanza, inclusi il nome dell'istanza personalizzabile, i dischi permanenti e i metadati.

Per ulteriori informazioni, consulta la sezione Gruppi di istanze gestite stateful.

Crea tutte le VM GPU contemporaneamente

Puoi creare una richiesta di ridimensionamento in un MIG con VM GPU per creare tutte le VM richieste contemporaneamente quando la capacità richiesta diventa disponibile. Quando crei una richiesta di ridimensionamento in un gruppo di istanze gestite, Compute Engine pianifica creazione delle VM in base al numero di VM richieste, la loro esecuzione richiesta e la disponibilità delle risorse richieste nelle zone gruppo di istanze gestite Quindi, al momento della distribuzione pianificata delle risorse, il gruppo di istanze gestite crea di VM contemporaneamente. Le VM vengono eseguite fino al termine della loro durata o fino a quando non le elimini.

Per ulteriori informazioni, vedi Informazioni sulle richieste di ridimensionamento in un gruppo di istanze gestite.

Gruppi di istanze prerilasciabili

Per i carichi di lavoro in cui i costi minimi sono più importanti della velocità di esecuzione, puoi ridurre il costo del carico di lavoro utilizzando istanze VM prerilasciabili nel gruppo di istanze. Le istanze prerilasciabili durano fino a 24 ore e vengono prerilasciata automaticamente: l'applicazione ha 30 secondi di tempo per uscire correttamente. Le istanze prerilasciabili possono essere eliminate in qualsiasi momento, ma la riparazione automatica quando la capacità prerilasciabile diventa di nuovo disponibile.

Container

Puoi semplificare il deployment delle applicazioni eseguendo il deployment dei container nelle istanze gruppi di istanze gestite Quando specifichi un'immagine container in un modello di istanza e utilizzare quel modello per creare un'istanza gestita gruppo, ogni VM viene creata con un sistema operativo ottimizzato per i container che include Docker e il container si avvia automaticamente su ogni VM gruppo. Consulta la sezione Eseguire il deployment di container su VM e gruppi di istanze gestite.

Rete e subnet

Quando crei un gruppo di istanze gestite, devi fare riferimento a una modello di istanza. Il modello di istanza definisce la rete VPC e la subnet utilizzate dalle istanze membro. Per VPC in modalità automatica reti, puoi omettere la subnet. questo indica a Google Cloud di selezionare la subnet creata automaticamente regione specificata nel modello. Se ometti una rete VPC, Google Cloud tenta di utilizzare la rete VPC denominata default.

Per ulteriori informazioni, consulta Reti e subnet.

Se vuoi che il gruppo di istanze gestite includa istanze VM che utilizzano IPv6 degli indirizzi, devi utilizzare l'impostazione dual-stack quando crei l'istanza modello. Per ulteriori informazioni, vedi Creare un modello di istanza con indirizzi IPv6.

Demo delle funzionalità MIG

La seguente presentazione video di 45 minuti, registrata a Google Cloud NEXT '18, contiene demo e best practice per la configurazione, l'esecuzione e l'aggiornamento di deployment scalabili e altamente disponibili utilizzando i gruppi di istanze gestite di Compute Engine.

Il video mostra come eseguire il deployment di un container in un gruppo di istanze gestite, configurare una riparazione automatica usa un gruppo a livello di regione per evitare un errore a livello di zona configurare la scalabilità automatica per soddisfare le richieste basate su code e target di CPU, nonché gestire canary e in sequenza.

Gruppi di istanze non gestite

I gruppi di istanze non gestite possono contenere istanze eterogenee che puoi aggiungere e rimuovere arbitrariamente dal gruppo. I gruppi di istanze non gestite non offrire scalabilità automatica, riparazione automatica, supporto per aggiornamenti in sequenza, supporto multizona l'uso di modelli di istanza e non sono adatti per eseguire un deployment carichi di lavoro scalabili e disponibili. Usa i gruppi di istanze non gestite se ne hai bisogno e per applicare il bilanciamento del carico a gruppi di eterogenee o se devi gestirle personalmente. Puoi aggiungere fino a 2000 VM a un gruppo. Se vuoi aggiungere più di 2000 VM al gruppo, contatta l'assistenza.

Se devi creare gruppi di istanze non gestite, consulta Gruppi di istanze non gestite.

Prezzi

Non sono previsti costi aggiuntivi per l'utilizzo di gruppi di istanze gestiti o non gestiti. Gli addebiti vengono effettuati in base alle risorse utilizzate dal tuo gruppo. Per informazioni sui prezzi di Compute Engine, consulta Prezzi.

Passaggi successivi