Durante un evento di manutenzione pianificata sull'istanza di una macchina virtuale (VM) l'hardware sottostante, Compute Engine potrebbe spostare la VM su un altro host. A una VM in esecuzione durante un evento host, Compute Engine esegue una migrazione della VM a un altro host nella stessa zona. Per ulteriori informazioni sugli eventi host, vedi Informazioni sugli eventi host.
La migrazione live consente a Google Cloud di eseguire la manutenzione senza interrompere un carico di lavoro. il riavvio di una VM o la modifica delle proprietà della VM, ad esempio indirizzi IP metadati, dati di archiviazione a blocchi, stato dell'applicazione e impostazioni di rete.
Oltre a mantenere le VM in esecuzione durante gli eventi host pianificati, mantiene le VM in esecuzione nei seguenti casi:
Manutenzione dell'infrastruttura. La manutenzione dell'infrastruttura include l'hardware, la rete e le reti elettriche dei data center, nonché i sistemi operativi e i bios host.
Aggiornamenti relativi alla sicurezza e modifiche alla configurazione di sistema. Questi includono: come l'installazione di patch di sicurezza e la modifica delle dimensioni per l'archiviazione dell'immagine e dei pacchetti del sistema operativo host.
Errori hardware. Sono inclusi errori di memoria, CPU, rete schede di interfaccia e dischi. Se l'hardware si guasta completamente o impedisce in altro modo la migrazione live, la VM viene interrotta, si riavvia automaticamente e Compute Engine registra un
hostError
.
Compute Engine esegue solo una migrazione live delle VM con criterio di manutenzione dell'host impostato per la migrazione. Per informazioni su come modificare criterio di manutenzione dell'host, consulta Impostare la manutenzione dell'host della VM .
Processo di migrazione live e SSD locali
Compute Engine può eseguire la migrazione live delle VM con SSD locali collegate, spostando le VM e le relative unità SSD locali su una nuova macchina in anticipo rispetto a qualsiasi manutenzione pianificata.
Limitazioni
La migrazione live non è supportata per i seguenti tipi di VM:
- La maggior parte delle istanze Confidential VM. Migrazione live per Le istanze Confidential VM sono supportate solo sui tipi di macchine N2D con Piattaforme CPU AMD EPYC Milan con AMD SEV. Tutti gli altri Le istanze Confidential VM non supportano la migrazione live e devono essere impostato per l'arresto e, facoltativamente, per il riavvio durante un evento di manutenzione dell'host. Per ulteriori dettagli, consulta la sezione Migrazione live.
VM con GPU collegate. Le istanze VM con GPU collegate devono essere impostate su arrestare e, facoltativamente, riavviare. Compute Engine offre un'esperienza prima dell'arresto di un'istanza VM con una GPU collegata. Per scoprire di più per informazioni su questi avvisi di eventi di manutenzione, leggi l'articolo Ricevere notifiche sulla migrazione live.
Per scoprire di più sulla gestione della manutenzione dell'host con le GPU, consulta Gestione dell'host manutenzione sulla documentazione delle GPU.
Cloud TPU. Le Cloud TPU non supportano la migrazione live.
VM prerilasciabili. Non puoi configurare un VM prerilasciabile per la migrazione live. La il comportamento di manutenzione delle istanze prerilasciabili è sempre impostato su
TERMINATE
per impostazione predefinita e non puoi modificare questa opzione. Non puoi impostare l'impostazione automatica di riavvio per le istanze prerilasciabili, avviare manualmente di nuovo dalla pagina dei dettagli delle istanze VM, una volta prerilasciata.Se devi modificare l'istanza in modo che non sia più prerilasciabile, scollega il disco di avvio dalla tua istanza prerilasciabile e lo colleghi a una nuova istanza non è configurato come prerilasciabile. Puoi anche creare uno snapshot del disco di avvio e usarlo per creare una nuova istanza senza prerilasciabilità.
VM spot. Le VM spot non possono migrazione live per diventare VM standard mentre sono in esecuzione o devono essere impostate su riavvio automatico quando c'è un evento organizzatore.
VM ottimizzate per l'archiviazione. Le VM Z3 non supportano la migrazione live. La il comportamento di manutenzione per le VM Z3 è impostato su
TERMINATE
.
Come funziona il processo di migrazione live?
Quando è pianificata la migrazione live di una VM, Google Cloud fornisce una notifica. Durante migrazione live, Google Cloud garantisce tempi di interruzione minimi, è in genere molto inferiore a 1 secondo. Se una VM non è impostata per la migrazione live, Compute Engine termina la VM durante la manutenzione dell'host. VM che sono impostati per terminare durante un evento host interrompere e (facoltativamente) riavviare.
Quando Google Cloud esegue la migrazione di una VM in esecuzione da un host a un altro, sposta lo stato completo della VM dall'origine alla destinazione in modo che sia trasparente per il sistema operativo guest e per qualsiasi comunicazione con il sistema operativo. Là sono molti i componenti che contribuiscono a far funzionare tutto senza problemi, ma la definizione di alto livello sono mostrati nella seguente illustrazione:
Il processo inizia con una notifica che indica che le VM devono essere spostate e l'attuale macchina host. La notifica potrebbe iniziare con una modifica del file che indica è disponibile una nuova versione del BIOS, una pianificazione delle operazioni hardware manutenzione o un segnale automatico di un imminente guasto hardware.
Il software di gestione dei cluster di Google Cloud controlla costantemente questi eventi e le pianifica in base ai criteri che controllano i data center, come la capacità e il numero di VM di cui un singolo cliente può eseguire la migrazione una volta sola.
Quando una VM viene selezionata per la migrazione, Google Cloud invia una notifica ospite che è in corso una migrazione. Dopo un periodo di attesa, un host target e all'host viene chiesto di configurare un nuovo "target" vuoto VM da ricevere l'"origine" di migrazione VM. L'autenticazione viene utilizzata per stabilire una connessione tra l'origine e la destinazione.
La migrazione della VM prevede tre fasi:
Brownout dell'alimentazione della sorgente. La VM è ancora in esecuzione sull'origine, la maggior parte degli stati viene inviata dall'origine alla destinazione. Ad esempio, Google Cloud copia tutta la memoria degli ospiti al target, mentre monitori le pagine che sono state modificata nell'origine. Il tempo trascorso nel brownout dell'origine è una funzione del dimensioni della memoria ospite e la frequenza con cui le pagine vengono modificate.
Oscuramento. Un momento molto breve in cui la VM non è in esecuzione da nessuna parte, la VM è in pausa e tutto lo stato rimanente è necessario per iniziare a eseguire la VM viene inviato il target. La VM entra nella fase di blackout durante l'invio dello stato durante l'origine il brownout raggiunge un punto in cui i rendimenti sono decrescenti. Viene utilizzato un algoritmo bilancia il numero di byte di memoria inviati con la velocità con cui la VM guest sta apportando modifiche.
Durante gli eventi di blackout, l'orologio di sistema scorre in avanti, fino a 5 secondi. Se un evento di blackout supera i 5 secondi, Google Cloud si arresta e risincronizza l'orologio utilizzando un daemon incluso nella VM pacchetti ospite.
Murout target. La VM viene eseguita sulla VM di destinazione. La VM di origine è presente e potrebbe fornire funzionalità di supporto per la VM di destinazione. Ad esempio, fino a quando l'infrastruttura di rete non ha raggiunto la nuova posizione della VM di destinazione, la VM di origine fornisce servizi di inoltro per i pacchetti verso e dalla VM di destinazione.
Infine, la migrazione è completata e il sistema elimina la VM di origine. Puoi vedrai che la migrazione è avvenuta Log delle VM.
Procedura di migrazione live manuale
Durante l'esecuzione del carico di lavoro, potresti voler spostare le VM su un nodo o un nodo diverso gruppo. La modalità single-tenancy consente di spostare le VM su un nodo single-tenant specifico o un gruppo di nodi. Se sposti una VM in un gruppo di nodi, Compute Engine determina su quale nodo posizionarlo. Per informazioni sulla single-tenancy, vedi Panoramica della single-tenancy.
Per spostare le VM single-tenant in un nodo o un gruppo di nodi diverso, puoi: avviare una migrazione live. Puoi anche avviare manualmente una migrazione live di una VM multi-tenant in modalità single-tenancy. Per ulteriori informazioni, consulta Eseguire manualmente la migrazione in tempo reale delle VM.
Passaggi successivi
Imposta il criterio di manutenzione dell'host VM per configurare le istanze per la migrazione live.
Leggi i suggerimenti per progettare un sistema solido in grado di gestire interruzioni del servizio.