Informazioni sugli eventi host

Puoi scegliere come rispondono le tue istanze di macchine virtuali (VM) durante o dopo un evento host impostando il criterio di manutenzione dell'host durante durante la creazione di una VM. Un evento organizzatore può includere la regolarità di manutenzione dell'infrastruttura Compute Engine o un errore dell'host su una VM. Di per impostazione predefinita, le VM sono impostate sulla migrazione live durante gli eventi del sistema host ma puoi impostarle su terminare e, facoltativamente, riavviare. Le VM Z3 rappresentano l'eccezione per la pubblicazione perché si riavviano per impostazione predefinita.

I seguenti eventi host portano alla migrazione live o all'interruzione della VM a seconda del criterio di manutenzione dell'host che hai impostato:

Eventi di manutenzione

Un evento di manutenzione si verifica quando Compute Engine arresta una VM per eseguire un aggiornamento hardware o software. Se abiliti la migrazione live la manutenzione dell'host le norme, Compute Engine sposta la VM su un nuovo host senza alcuna interruzione alla tua applicazione.

Il comportamento delle VM durante un evento di manutenzione può variare in base alla tenancy dello VM. La tabella seguente mostra alcuni le differenze di comportamento delle VM multi-tenant e single-tenant durante di manutenzione.

Tenancy host Frequenza approssimativa* Migrazione live al nuovo host Selezione dell'organizzatore
Multi-tenant Ogni 2 settimane Compute Engine
Single-tenant Ogni 4-6 settimane Dipende dal criterio di manutenzione dell'host Dipende dal criterio di manutenzione dell'host
*Queste frequenze sono approssimazioni, A volte Compute Engine potrebbe eseguire la manutenzione con maggiore frequenza.

Compute Engine applica anche un hypervisor leggero in background senza interruzioni.

Criterio di manutenzione dell'host

Il criterio di manutenzione dell'host di una VM determina il suo comportamento durante le eventi:

  • In caso di evento di manutenzione in cui Google deve spostare una VM su un altro host macchina
  • Quando si verifica un errore dell'host per cui Google deve terminare o riavviare una VM

Puoi configurare le VM in modo che continuino a essere eseguite durante la manutenzione dell'host, Compute Engine esegue la migrazione live su un altro host oppure puoi scegliere e arrestare le VM. Puoi aggiornare la manutenzione dell'host di una VM in qualsiasi momento per controllare il comportamento delle VM.

Puoi modificare il criterio di manutenzione dell'host di una VM configurando quanto segue impostazioni:

  • Comportamento di manutenzione: indica se la VM è in fase di migrazione in tempo reale o è stata arrestata quando c'è un evento di manutenzione.
  • Comportamento al riavvio:indica se Compute Engine si riavvia o termina sulla VM se la VM ha un arresto anomalo o si verifica un errore dell'host.
  • Tempo di rilevamento degli errori dell'host: il periodo di tempo massimo Compute Engine attende il riavvio o la terminazione di una VM dopo aver rilevato che la VM non risponde.
  • Tempo di recupero degli SSD locali:la quantità di tempo massima di Compute Engine recupera i dati sui dischi SSD locali dopo aver rilevato un errore dell'host. Il team I dati SSD vengono persi se il tempo specificato scade senza che il ripristino sia andato a buon fine.

Pianificazione della manutenzione

Google Cloud offre funzionalità che consentono un controllo più rigido sulla manutenzione. Utilizzando alcune famiglie di VM, puoi specificare le preferenze di manutenzione per ricevere notifiche di più giorni in Cloud Logging. Al ricevimento di una notifica: puoi attivare la manutenzione in qualsiasi momento evento pianificato.

Puoi utilizzare queste funzionalità in combinazione con il criterio di manutenzione dell'host per per personalizzare una pianificazione adatta al carico di lavoro.

Migrazione live

Per impostazione predefinita, tutte le VM tranne le VM Z3 sono impostati su live Migrate, dove Compute Engine esegue automaticamente la migrazione della VM dell'infrastruttura, e la VM rimane in esecuzione migrazione. La tua VM potrebbe registrare un breve periodo di riduzione delle prestazioni, ma in generale, la maggior parte delle VM non dovrebbe presentare differenze notevolmente diverse. Questo è ideale per le VM che richiedono un tempo di attività costante e sono in grado di tollerare una breve di riduzione delle prestazioni.

Quando Compute Engine esegue la migrazione della VM, registra un evento di sistema pubblicato nell'elenco delle operazioni per zona. Puoi rivedi questo evento di la visualizzazione delle operazioni di Compute Engine per una zona specifica. Gli eventi di migrazione live hanno il seguente tipo di operazione:

    compute.instances.migrateOnHostMaintenance

Interrompi e (facoltativamente) riavvia

Se non vuoi eseguire la migrazione live della VM, puoi scegliere di arrestare e facoltativamente riavviare la VM. Per le VM impostate su arresto e riavvio facoltativo, Compute Engine invia un segnale di spegnimento graduale per arrestare la VM. Poi, attende 60 secondi per il corretto arresto della VM, la termina e lo riavvia lontano dall'evento di manutenzione. Se la VM non si arresta in modo pulito in 60 secondi, viene arrestata.

Questa opzione è ideale se le tue VM richiedono prestazioni sempre massime e se l'applicazione nel suo complesso è creata per gestire gli errori o i riavvii delle VM.

Quando Compute Engine arresta e riavvia le VM, segnala un evento di sistema pubblicato nell'elenco delle operazioni per zona. Puoi rivedi questo evento di la visualizzazione delle operazioni di Compute Engine per una zona specifica. Gli eventi interrotti hanno il seguente tipo di operazione:

compute.instances.terminateOnHostMaintenance

Al riavvio, la VM utilizza lo stesso disco di avvio permanente ricollega eventuali dischi permanenti secondari che hai configurato. I dati su questi i dischi permanenti vengono mantenuti durante la migrazione e il riavvio delle VM.

I dati degli SSD locali non vengono mantenuti quando una VM viene arrestata a causa di un evento di manutenzione. Quando la VM si riavvia, crea un nuovo SSD locale che devi formattare e montare.

I dati degli SSD locali vengono mantenuti quando i dati sono ottimizzati per lo spazio di archiviazione VM Z3. In caso di evento di manutenzione, la VM Z3 si riavvia in loco anziché migrazione a un nuovo host. Al termine della manutenzione di routine, la VM è stata riavviata. Google Cloud fa il possibile per garantire che i dati degli SSD locali rimangono intatti. Tuttavia, in alcuni casi i dati non possono essere recuperati, ad esempio come un caso di timeout.

Riavvio automatico

Se la VM è impostata per arrestarsi quando c'è un evento di manutenzione o La VM si arresta in modo anomalo a causa di un problema hardware sottostante, puoi impostare di riavviare automaticamente la VM impostando automaticRestart su true. Questa impostazione non si applica se La VM viene disconnessa da un'azione dell'utente, ad esempio una chiamata sudo shutdown o durante un'interruzione della zona.

Quando Compute Engine riavvia automaticamente la VM, segnala un evento di sistema pubblicato nell'elenco delle operazioni per zona. Puoi rivedi questo evento di la visualizzazione delle operazioni di Compute Engine per una zona specifica. Gli eventi di riavvio automatico hanno il seguente tipo di operazione:

compute.instances.automaticRestart

Errori relativi all'host

Un errore dell'host (compute.instances.hostError) indica che era presente un hardware o un problema software sull'hosting della macchina fisica sulla VM che ne ha causato l'arresto anomalo. Un errore dell'host che riguarda l'hardware totale guasti o altri problemi hardware potrebbero impedire migrazione live della VM. Se la VM è impostata per il riavvio automatico, ovvero predefinita, Google riavvia la VM, in genere entro tre minuti dal momento in cui si verifica l'errore è stato rilevato. A seconda del problema, il riavvio potrebbe richiedere fino a 5,5 minuti.

VM con dischi SSD locali

Se si verifica un errore dell'host su una VM che ha uno o più SSD locali dischi collegati, Compute Engine fa il possibile per riconnettersi alla VM e preservare l'SSD locale e i dati di Google Cloud. Mentre Compute Engine recupera la VM e il disco SSD locale, il sistema host e il disco sottostante non rispondono.

Puoi specificare il tempo che Compute Engine impiega per i tentativi di ripristino Dati degli SSD locali impostando il timeout del ripristino degli SSD locali.

Per ulteriori informazioni su come l'SSD locale si comportano quando si verifica un errore dell'host, vedi Persistenza dei dati degli SSD locali.

VM che non rispondono

A volte, una VM potrebbe non rispondere prima che venga rilevato un errore dell'host. Puoi ridurre Tempo di attesa di Compute Engine per riavviare o terminare la VM impostando il ripristino dagli errori dell'host timeout (Anteprima). Per ulteriori informazioni, vedi Imposta i criteri di disponibilità.

I guasti fisici e del software possono verificarsi occasionalmente, ma sono rari casi. Per proteggere le tue applicazioni e i tuoi servizi da questi eventi di sistema potenzialmente invasivi, consulta le seguenti risorse:

Google offre inoltre servizi gestiti come App Engine e Ambiente flessibile di App Engine.

Timeout del ripristino degli SSD locali

Quando si verifica un errore dell'host, Compute Engine tenta di recuperare eventuali i dischi SSD collegati alla VM. Puoi controllare per quanto tempo Compute Engine per tentare di recuperare i dati con il timeout del recupero degli SSD locali. Per impostazione predefinita, Compute Engine impiega un'ora per recuperare i dati, ma i valori validi sono comprese tra 0 e 168, con incrementi di 1 ora. L'eccezione a questa regola è Z3, ha un tempo di recupero predefinito di massimo 6 ore.

Se il timeout scade e i dati continuano a non essere recuperati, Compute Engine riavvia la VM senza il disco SSD locale. Compute Engine collega un nuovo un disco SSD locale vuoto sulla VM riavviata.

Se il timeout è di 1 ora o più, la VM si trova in una REPAIRING mentre Compute Engine recupera tutti i dischi SSD locali collegati. La VM I dischi SSD locali non rispondono durante il ripristino.

Se il timeout è 0, Compute Engine non tenterà di recuperare l'SSD locale e i dati non sono recuperabili. Puoi impostare il timeout di recupero su 0 se Il ripristino del carico di lavoro è più importante che recuperare i dati degli SSD locali.

Arresta il ripristino del disco SSD locale

Puoi interrompere il processo di ripristino prima del timeout del ripristino degli SSD locali scade. A questo scopo, utilizza il comando gcloud compute instances stop con il flag --discard-local-ssd=True.

Questa operazione interromperà il processo di ripristino, arresta la VM e elimina i dati degli SSD locali. Puoi riavviare la VM in un secondo momento. Vedi Arrestare una VM con SSD locale per ulteriori informazioni.

Per impostare il timeout del recupero degli SSD locali, vedi Configurare i criteri di manutenzione dell'host della VM.

Passaggi successivi