Informazioni sulla replica dei dischi sincroni


Il disco permanente regionale e l'alta disponibilità Hyperdisk bilanciata sono opzioni di archiviazione che consentono di implementare ad alta disponibilità in Compute Engine. Il disco permanente regionale e l'alta disponibilità Hyperdisk bilanciata replicano in modo sincrono i dati tra due nella stessa regione e garantire l'alta disponibilità per i dati del disco per un massimo di a livello di zona.

I volumi disco permanente regionale e Hyperdisk ad alta disponibilità bilanciati sono progettati per carichi di lavoro richiedono un RPO (Recovery Point Objective) e un Recovery Time Objective (RPO) più bassi (RTO). Per scoprire di più su RPO e RTO, consulta Nozioni di base sulla pianificazione del ripristino di emergenza.

I volumi di dischi permanenti regionali e iperdischi bilanciati ad alta disponibilità progettato per funzionare con regioni gruppi di istanze gestite,

Questo documento fornisce una panoramica su come creare servizi ad alta disponibilità con Volumi permanenti a livello di regione e Hyperdisk bilanciati ad alta disponibilità.

Quando decidi di utilizzare un disco permanente regionale o una disponibilità elevata con Hyperdisk Balanced, Confrontare le diverse opzioni per aumentare la disponibilità del servizio costi, prestazioni e resilienza per diverse architetture di servizio.

Informazioni sulla replica sincrona dei dischi

Un volume Hyperdisk bilanciato ad alta disponibilità (anteprima) o disco permanente regionale, chiamato anche disco replicato, ha una zona principale e una secondaria all'interno della regione in cui memorizza i dati del disco:

  • La zona principale è la stessa in cui si trova l'istanza Compute che colleghi in cui si trova il disco.
  • Zona secondaria è una zona alternativa a tua scelta all'interno della stessa regione.

Compute Engine gestisce le repliche del disco in entrambe queste zone. Quando scrivi i dati sul disco, Compute Engine in modo sincrono replica i dati nelle repliche del disco in entrambe le zone per garantire l'alta disponibilità. I dati di ciascuna replica a livello di zona è distribuita su più macchine fisiche all'interno per garantirne la durabilità. Le repliche di zona assicurano che i dati il disco rimane disponibile e offre protezione o in caso di interruzione del servizio in una delle zone del disco.

Stato della replica per le repliche a livello di zona

Lo stato della replica del disco per i dischi permanenti regionali o Hyperdisk bilanciato con disponibilità elevata (anteprima) mostra lo stato di una replica a livello di zona rispetto ai contenuti del disco. Repliche di zona per i tuoi dischi si trovano sempre in uno dei seguenti stati di replica:

  • Sincronizzata: la replica è disponibile, riceve tutte le scritture in modo sincrono eseguito sul disco ed è aggiornato con tutti i dati presenti sul disco.
  • Aggiornamento: la replica è disponibile, ma è ancora in fase di aggiornamento con i dati sul disco dell'altra replica.
  • Non sincronizzata: la replica è temporaneamente non disponibile e non sincronizzata. con i dati sul disco.

Per scoprire come controllare e monitorare gli stati delle repliche zonali, consulta Monitorare gli stati delle repliche dei dischi.

Stati di replica per dischi replicati in modo sincrono

A seconda dello stato delle singole repliche zonali, il volume Hyperdisk bilanciato con disponibilità elevata (anteprima) può trovarsi in uno dei seguenti stati di replica:

  • Completamente replicato: le repliche in entrambe le zone sono disponibili e vengono sincronizzate con i dati più recenti del disco.
  • Aggiornamento: le repliche a livello di zona sono disponibili, ma una delle di repliche si sta mettendo al passo con i dati del disco più recenti.
  • Degradato: una delle repliche zonali ha lo stato out of sync a causa di un guasto o un'interruzione.

Se lo stato della replica del disco è catching up o degraded, una delle repliche a livello di zona non è aggiornata con tutti i dati. Qualsiasi interruzione durante di tempo nella zona della replica integro comporta un'indisponibilità del il disco finché la zona di replica integra.

Quando il tuo Il volume del disco permanente regionale o a disponibilità elevata con Hyperdisk Balanced è in fase di recupero, Google Cloud inizia a riparare la replica a livello di zona che sta controllando. Google consiglia di attendere che la replica zonale interessata raggiunga i dati sul disco, a quel punto il suo stato diventa Synced. Dopo il la replica a livello di zona passa quindi allo stato sincronizzato, allo stato del disco replicato torna allo stato Fully replicated.

Se il disco replicato ha lo stato catching up o degraded per un periodo di tempo prolungato e non soddisfa i requisiti RPO della tua organizzazione, consigliamo di acquisire snapshot della replica principale in uno dei modi seguenti:

  • Attiva gli snapshot pianificati.
  • Crea uno snapshot manuale dei tuoi Disco permanente regionale o disco a disponibilità elevata con bilanciato Hyperdisk.

Dopo aver creato uno snapshot, puoi creare un nuovo disco regionale permanente o Hyperdisk bilanciato ad alta disponibilità utilizzando lo snapshot come origine. Lo snapshot viene ripristinato sul nuovo disco. Il tuo nuovo Inoltre, il disco viene avviato in uno stato completamente replicato con replica dei dati integro.

Per scoprire come controllare lo stato di replica del tuo Disco permanente regionale o disco a disponibilità elevata bilanciata con Hyperdisk, consulta Determina lo stato di replica dei dischi.

Checkpoint di recupero della replica

Un controllo punto di ripristino della replica è un attributo del disco che rappresenta il punto in tempo coerente con gli arresti anomali più recente di un disco completamente replicato. Compute Engine crea automaticamente e mantiene un singolo checkpoint di recupero della replica per ogni disco replicato. Quando un disco viene completamente replicato, Compute Engine continua ad aggiornare il checkpoint circa ogni 10 minuti per il checkpoint rimane aggiornato. Quando lo stato della replica del disco è degraded, Compute Engine ti consente di creare uno snapshot standard dal checkpoint di recupero della replica del disco. Lo snapshot standard risultante acquisisce i dati dalla versione più recente del disco completamente replicato in caso di arresto anomalo.

In rari casi, quando il disco è in stato di degrado, anche la replica zonale sincronizzata con i dati più recenti del disco può non riuscire prima che la replica non sincronizzata venga aggiornata. Non potrai forzare l'associazione del disco a di calcolo delle istanze in una delle zone. Il disco replicato non è più disponibile e devi migrare i dati su un nuovo disco. In questi scenari, se non sono disponibili snapshot standard per il disco, potresti comunque riuscire a recuperare i dati del disco dalla replica incompleta utilizzando uno snapshot standard creato dal checkpoint di recupero della replica.

Compute Engine crea automaticamente checkpoint di recupero della replica montato Disco permanente regionale o disponibilità elevata con Hyperdisk Bilanciato (Anteprima). La creazione di questi punti di controllo non comporta costi aggiuntivi. Tuttavia, ti sono dovuti eventuali costi di archiviazione applicabili per la creazione di snapshot e quando utilizzi questi checkpoint per eseguire la migrazione del disco replicato zone di funzionamento.

Scopri di più su come ripristinare i dati dei dischi replicati utilizzando un checkpoint di recupero della replica.

Failover del disco replicato

In caso di interruzione in una zona, la zona diventa inaccessibile e l'istanza di calcolo al suo interno non può eseguire operazioni di lettura o scrittura sul proprio disco. consentire all'istanza di continuare a eseguire operazioni di lettura e scrittura per dal disco replicato, Compute Engine consente la migrazione dei dati in cui il disco ha una replica. Questo processo è noto come failover.

Il processo di failover prevede lo scollegamento della replica zonale dall'istanza nella zona interessata e il successivo collegamento della replica zonale a una nuova istanza nella zona secondaria. Compute Engine replica in modo sincrono i dati il disco alla zona secondaria per garantire un rapido failover in caso di errore di replica non riuscito.

Failover da parte del piano di controllo regionale specifico dell'applicazione

Il piano di controllo a livello di regione specifico per l'applicazione non è un servizio Google Cloud. Quando progetti architetture di servizi ad alta disponibilità, devi creare il tuo control plane regionale specifico per l'applicazione. Questo piano di controllo delle applicazioni decide a quale istanza deve essere collegato il disco replicato e quale istanza è l'istanza principale corrente.

Quando viene rilevato un errore nell'istanza o nel database principale di sul disco replicato, il piano di controllo regionale specifico per l'applicazione della tua architettura del servizio ad alta disponibilità può avviare automaticamente in standby nella zona secondaria. Durante il failover, il piano di controllo regionale specifico per l'applicazione ricollega il disco replicato all'istanza in standby nella zona secondaria. Compute Engine indirizzerà quindi tutto il traffico a quell'istanza in base agli indicatori dei controlli di integrità.

La latenza complessiva di failover, escluso il tempo di rilevamento degli errori, è la somma dei le seguenti latenze:

  • Meno di un minuto per collegare un disco replicato a un'istanza in standby
  • Tempo necessario per l'inizializzazione dell'applicazione e il recupero in caso di arresto anomalo

Per ulteriori informazioni, consulta Informazioni sul piano di controllo regionale specifico per l'applicazione.

Componenti di base per il ripristino di emergenza che illustra i componenti di base disponibili su Compute Engine.

Failover mediante collegamento forzato

Uno dei vantaggi di Disco permanente regionale e disponibilità elevata con Hyperdisk bilanciato (Anteprima) è che improbabile evento di interruzione a livello di zona, puoi eseguire manualmente il failover in un'altra zona. Quando si verifica un'interruzione nella zona originale, non puoi per completare l'operazione di scollegamento del disco fino al ripristino della replica a livello di zona. In questo scenario, potrebbe essere necessario collegare la replica zonale secondaria a una nuova istanza di calcolo senza scollegare la replica zonale principale dall'istanza principale. Questa procedura è chiamata force-attach.

Quando l'istanza Compute nella zona principale non è più disponibile, puoi per forzare il collegamento del disco a un'istanza nella zona secondaria. Per eseguire questa operazione, devi svolgere una delle seguenti operazioni:

  • Avvia un'altra istanza di calcolo nella stessa zona del disco replicato che stai collegando forzatamente.
  • Mantieni un'istanza di calcolo hot standby in quella zona. Un hot standby è un'istanza in esecuzione identica a quella nella zona principale. Le due istanze hanno gli stessi dati.

Compute Engine esegue l'operazione di attacco forzato in meno di un minuto. L'RTO (Recovery Time Objective) totale dipende non solo dal failover dello spazio di archiviazione (l'attacco forzato del disco replicato), ma anche da altri fattori, tra cui:

  • Indica se devi prima creare un'istanza secondaria
  • Il tempo impiegato dal file system sottostante per rilevare un disco collegato a caldo
  • Il tempo di ripristino delle applicazioni corrispondenti

Per saperne di più su come eseguire il failover dell'istanza Compute utilizzando Forza collegamento, vedi Failover del disco replicato utilizzando force-attach.

Il disco permanente regionale e l' alta disponibilità con iperdisco bilanciato favoriscono il carico di lavoro il che comporta alcuni compromessi per quanto riguarda la protezione dei dati è improbabile che entrambe le repliche del disco non siano disponibili contemporaneamente. Per ulteriori informazioni, vedi Gestione degli errori per i dischi replicati.

Limitazioni

Le seguenti sezioni elencano le limitazioni che si applicano Disco permanente regionale e disponibilità elevata con Hyperdisk bilanciato (anteprima).

Limitazioni generali per i dischi replicati

  • È possibile collegare un disco permanente regionale solo alle macchine virtuali che utilizzano come machine family E2, N1, N2 e N2D.
  • Puoi collegare l'alta disponibilità Hyperdisk Balanced solo ai supporti tipi di macchine.
  • Non puoi creare un disco permanente di una regione da un'immagine o da un disco creato da un'immagine.
  • Quando utilizzi la modalità di sola lettura, puoi collegare un disco permanente bilanciato regionale a un massimo di 10 istanze VM.
  • La dimensione minima di un disco permanente standard regionale è 200 GiB.
  • Puoi solo aumentare la dimensione di un disco Persistent Disk o volume Hyperdisk Bilanciato ad alta disponibilità; non puoi ridurne le dimensioni.
  • I volumi di disco permanente regionale e iperdisco bilanciato ad alta disponibilità hanno prestazioni diverse rispetto ai dischi di zona corrispondenti. Per ulteriori informazioni, consulta Rendimento dello spazio di archiviazione a blocchi.
  • Non puoi utilizzare un volume Hyperdisk bilanciato con disponibilità elevata in modalità multi-writer come disco di avvio.
  • Se crei un disco replicato clonando un disco a livello di zona, le due repliche non sono completamente sincronizzati al momento della creazione. Dopo la creazione, puoi utilizzare la copia del disco regionale in media entro 3 minuti. Tuttavia, potresti dover attendere decine di minuti prima che il disco raggiunga uno stato completamente replicato e il Recovery Point Objective (RPO) sia vicino allo zero. Scopri come verifica che il disco replicato sia completamente replicato.

Limitazioni per i checkpoint di recupero delle repliche

  • Un checkpoint di recupero della replica fa parte dei metadati del dispositivo e non viene visualizzato i dati del disco da soli. Puoi utilizzare il checkpoint solo come meccanismo per creare uno snapshot del disco in degrado. Dopo aver creato lo snapshot utilizzando il checkpoint, puoi utilizzarlo per ripristinare i dati.
  • Puoi creare snapshot da un checkpoint di recupero della replica solo quando il disco le prestazioni sono ridotte.
  • Compute Engine aggiorna il checkpoint di ripristino della replica del disco solo quando il disco è completamente replicato.
  • Compute Engine gestisce un solo checkpoint di recupero della replica per un disco e solo la versione più recente di questo checkpoint.
  • Non puoi visualizzare i timestamp esatti di creazione e aggiornamento di un checkpoint di recupero della replica.
  • Puoi creare uno snapshot dal checkpoint di recupero della replica solo utilizzando l'API Compute Engine.

Passaggi successivi