Informazioni sulla replica dei dischi sincroni

L'alta disponibilità Hyperdisk Balanced è un'opzione di archiviazione che consente di implementare ad alta disponibilità in Compute Engine. L'alta disponibilità Hyperdisk Balanced replica in modo sincrono i dati tra due zone nella stessa regione e garantisce l'alta disponibilità per i dati del disco fino a un errore a livello di zona.

I volumi ad alta disponibilità bilanciati Hyperdisk sono progettati per carichi di lavoro che richiedono un recupero inferiore RPO (RPO) e RTO (Recovery Time Objective). Per scoprire di più su RPO e RTO, vedi Nozioni di base sulla pianificazione del ripristino di emergenza. iperdisco bilanciato ad alta disponibilità progettato per funzionare con regioni gruppi di istanze gestite,

Questo documento fornisce una panoramica su come creare servizi ad alta disponibilità con Hyperdisk bilanciati ad alta disponibilità.

Quando decidi di utilizzare disponibilità elevata con Hyperdisk Balanced, Confrontare le diverse opzioni per aumentare la disponibilità del servizio costi, prestazioni e resilienza per diverse architetture di servizio.

Informazioni sulla replica dei dischi sincroni

disponibilità elevata con Hyperdisk Balanced (anteprima), noto anche come volume replicato, ha una zona principale e una secondaria all'interno della sua regione in cui archivia i dati del disco:

  • La zona principale è la stessa in cui si trova l'istanza Compute che colleghi in cui si trova il disco.
  • La zona secondaria è una zona alternativa a tua scelta all'interno dello stesso. regione.

Compute Engine conserva le repliche del disco queste zone. Quando scrivi i dati sul disco, Compute Engine in modo sincrono replica i dati nelle repliche del disco in entrambe le zone per garantire l'alta disponibilità. I dati di ciascuna replica a livello di zona è distribuita su più macchine fisiche all'interno per garantirne la durabilità. Le repliche di zona assicurano che i dati il disco rimane disponibile e offre protezione o in caso di interruzione del servizio in una delle zone del disco.

Stato della replica per le repliche a livello di zona

Stato replica disco per disponibilità elevata con Hyperdisk Balanced (Anteprima) mostra lo stato a una replica a livello di zona rispetto al contenuto del disco. Repliche di zona per i tuoi dischi si trovano sempre in uno dei seguenti stati di replica:

  • Sincronizzata: la replica è disponibile, riceve tutte le scritture in modo sincrono eseguito sul disco ed è aggiornato con tutti i dati presenti sul disco.
  • Recupero: la replica è disponibile, ma sta ancora tentando di recuperare i dati sul disco dall'altra replica.
  • Non sincronizzata: la replica è temporaneamente non disponibile e non sincronizzata. con i dati sul disco.

Per scoprire come controllare e monitorare gli stati delle repliche delle repliche a livello di zona, consulta Monitorare gli stati di replica del disco.

Stati di replica per dischi replicati in modo sincrono

A seconda dello stato delle singole repliche a livello di zona, disponibilità elevata con Hyperdisk Balanced (Anteprima) il volume può essere in uno di i seguenti stati di replica:

  • Completamente replicate: le repliche in entrambe le zone sono disponibili e vengono sincronizzati con i dati del disco più recenti.
  • Aggiornamento: le repliche a livello di zona sono disponibili, ma una delle di repliche si sta mettendo al passo con i dati del disco più recenti.
  • Compromissione:una delle repliche a livello di zona ha lo stato out of sync a causa di un errore o un'interruzione del servizio.

Se lo stato di replica del disco è catching up o degraded, uno dei seguenti valori: le repliche a livello di zona non vengono aggiornate con tutti i dati. Qualsiasi interruzione durante di tempo nella zona della replica integro comporta un'indisponibilità del il disco finché la zona di replica integra non viene ripristinata.

Quando il tuo a disponibilità elevata con iperdisco bilanciato è in fase di recupero, Google Cloud inizia a riparare la replica a livello di zona che sta controllando. Google consiglia di attendere che la replica a livello di zona interessata raggiunga il i dati sul disco, dopodiché il suo stato diventa Synced. Dopo il la replica a livello di zona passa quindi allo stato sincronizzato, lo stato del disco replicato torna allo stato Fully replicated.

Se lo stato del disco replicato è catching up o degraded per un per un periodo di tempo prolungato e non soddisfa i requisiti RPO della tua organizzazione, ti consigliamo di acquisire snapshot della replica principale in uno dei nei seguenti modi:

  • Abilita snapshot pianificati.
  • Crea uno snapshot manuale dei tuoi disco a disponibilità elevata con bilanciato Hyperdisk.

Dopo aver creato uno snapshot, puoi crearne uno nuovo disco a disponibilità elevata bilanciata con Hyperdisk utilizzando snapshot come origine. Lo snapshot viene ripristinato sul nuovo disco. Il tuo nuovo Inoltre, il disco viene avviato in uno stato completamente replicato con replica dei dati integro.

Per scoprire come controllare lo stato di replica del tuo disco a disponibilità elevata bilanciata con Hyperdisk, consulta Determina lo stato di replica dei dischi.

Checkpoint di recupero della replica

Un checkpoint di recupero delle repliche è un attributo del disco che rappresenta il modello più recente coerente con arresti anomali di un disco completamente replicato. Compute Engine crea automaticamente e mantiene un singolo checkpoint di recupero della replica per ogni disco replicato. Quando un disco viene completamente replicato, Compute Engine continua ad aggiornare il checkpoint circa ogni 10 minuti per il checkpoint rimane aggiornato. Se lo stato di replica del disco è degraded, Compute Engine consente di creare uno snapshot standard il checkpoint di ripristino della replica di quel disco. Lo snapshot standard risultante acquisisce i dati dalla versione più recente coerente con gli arresti anomali dell'interfaccia il disco replicato.

In rari casi, quando le prestazioni del disco sono ridotte, la replica a livello di zona sincronizzati con i dati del disco più recenti possono inoltre avere esito negativo prima che la la replica riesce a stare al passo. Non potrai forzare l'associazione del disco a di calcolo delle istanze in una delle zone. Il disco replicato non è più disponibile e devi migrare i dati su un nuovo disco. In questi scenari, se non disponi di snapshot standard esistenti per il disco, potresti comunque riuscire a recuperarlo i dati della replica incompleta utilizzando uno snapshot standard creato dal checkpoint di recupero della replica.

Compute Engine crea automaticamente i checkpoint di recupero della replica montato disponibilità elevata con Hyperdisk Balanced (Anteprima). Non ti viene addebitato alcun costo costi aggiuntivi per la creazione di questi checkpoint. Tuttavia, ti sono dovuti eventuali costi di archiviazione applicabili per la creazione di snapshot e quando utilizzi questi checkpoint per eseguire la migrazione del disco replicato zone di funzionamento.

Scopri di più su come recuperare i dati del disco replicato utilizzando un checkpoint di recupero della replica.

Failover del disco replicato

In caso di interruzione di una zona, quest'ultima diventa inaccessibile e Compute in quella zona non può eseguire operazioni di lettura o scrittura disco. consentire all'istanza di continuare a eseguire operazioni di lettura e scrittura per dal disco replicato, Compute Engine consente la migrazione dei dati in cui il disco ha una replica. Questo processo è noto come failover.

Il processo di failover prevede lo scollegamento della replica a livello di zona dall'istanza della zona interessata e collegare la replica di zona a una nuova istanza la zona secondaria. Compute Engine replica in modo sincrono i dati il disco alla zona secondaria per garantire un rapido failover in caso di errore di replica non riuscito.

Failover da parte del piano di controllo regionale specifico dell'applicazione

Il piano di controllo a livello di regione specifico per l'applicazione non è un servizio Google Cloud. Quando progetti architetture di servizi ad alta disponibilità, devi creare a un piano di controllo regionale specifico per l'applicazione. Questo piano di controllo delle applicazioni decide a quale istanza deve essere collegato il disco replicato è l'istanza principale attuale.

Quando viene rilevato un errore nell'istanza o nel database principale di sul disco replicato, il piano di controllo regionale specifico per l'applicazione della tua architettura del servizio ad alta disponibilità può avviare automaticamente in standby nella zona secondaria. Durante il failover, specifico dell'applicazione, ricollega il disco replicato all'istanza in standby nella zona secondaria. Compute Engine indirizza quindi tutti a quella istanza in base agli indicatori del controllo di integrità.

La latenza complessiva di failover, escluso il tempo di rilevamento degli errori, è la somma dei le seguenti latenze:

  • Meno di un minuto per collegare un disco replicato a un'istanza in standby
  • Tempo necessario per l'inizializzazione dell'applicazione e il ripristino in seguito a un arresto anomalo

Per ulteriori informazioni, vedi Informazioni sul piano di controllo regionale specifico per l'applicazione.

Componenti di base per il ripristino di emergenza che illustra i componenti di base disponibili su Compute Engine.

Failover mediante collegamento forzato

Uno dei vantaggi di disponibilità elevata con Hyperdisk bilanciato (Anteprima) è che improbabile evento di interruzione a livello di zona, puoi eseguire manualmente il failover in un'altra zona. Quando si verifica un'interruzione nella zona originale, non puoi per completare l'operazione di scollegamento del disco fino al ripristino della replica a livello di zona. In questo potresti dover collegare la replica di zona secondaria a un Compute senza scollegare la replica di zona principale dalla replica in esecuzione in un'istanza Compute Engine. Questa procedura è chiamata force-attach.

Quando l'istanza Compute nella zona principale non è più disponibile, puoi per forzare il collegamento del disco a un'istanza nella zona secondaria. Per eseguire questa attività, devi eseguire una delle seguenti operazioni:

  • Avvia un'altra istanza di computing nella stessa zona del disco replicato che stai applicando forzando.
  • Mantieni un'istanza di computing in hot standby in quella zona. Un hot standby è un di un'istanza in esecuzione identica a quella nella zona principale. I due contengono gli stessi dati.

Compute Engine esegue l'operazione di collegamento forzato in meno di un minuto. L'RTO (Recovery Time Objective) totale. dipende non solo dal failover dello spazio di archiviazione (l'operazione forzata del collegamento disco), ma anche su altri fattori, tra cui:

  • Indica se devi prima creare un'istanza secondaria
  • Il tempo impiegato dal file system sottostante per rilevare un disco collegato a caldo
  • Il tempo di ripristino delle applicazioni corrispondenti

Per saperne di più su come eseguire il failover dell'istanza Compute Forza collegamento, vedi Failover del disco replicato utilizzando force-attach.

alta disponibilità con iperdisco bilanciato favoriscono il carico di lavoro il che comporta alcuni compromessi per quanto riguarda la protezione dei dati è improbabile che entrambe le repliche del disco non siano disponibili contemporaneamente. Per ulteriori informazioni, vedi Gestione degli errori per i dischi replicati.

Limitazioni

Le seguenti sezioni elencano le limitazioni che si applicano disponibilità elevata con Hyperdisk bilanciato (anteprima).

Limitazioni generali per i dischi replicati

  • Puoi collegare l'alta disponibilità Hyperdisk Balanced solo ai supporti tipi di macchine.
  • Puoi solo aumentare la dimensione di un volume Hyperdisk Bilanciato ad alta disponibilità; non puoi ridurne le dimensioni.
  • iperdisco bilanciato ad alta disponibilità hanno prestazioni diverse rispetto ai dischi di zona corrispondenti. Per ulteriori informazioni, vedi Blocca le prestazioni dello spazio di archiviazione.
  • Se crei un disco replicato clonando un disco a livello di zona, le due repliche non sono completamente sincronizzati al momento della creazione. Dopo la creazione, puoi utilizzare il disco regionale clone entro 3 minuti, in media. Tuttavia, potresti dover attendere decine di minuti prima che il disco raggiunga uno stato completamente replicato Il Recovery Point Objective (RPO) è vicino allo zero. Scopri come verifica che il disco replicato sia completamente replicato.

Limitazioni per i checkpoint di recupero della replica

  • Un checkpoint di recupero della replica fa parte dei metadati del dispositivo e non viene visualizzato i dati del disco da soli. Il checkpoint può essere utilizzato solo come meccanismo crea uno snapshot del disco con prestazioni ridotte. Dopo aver creato lo snapshot utilizzando al checkpoint, puoi usare lo snapshot per ripristinare i dati.
  • Puoi creare snapshot da un checkpoint di recupero della replica solo quando il disco le prestazioni sono ridotte.
  • Compute Engine aggiorna il checkpoint di recupero della replica del disco solo quando completamente replicato.
  • Compute Engine mantiene solo un checkpoint di recupero della replica per un disco gestisce solo l'ultima versione di quel checkpoint.
  • Non puoi visualizzare i timestamp esatti di creazione e aggiornamento di un recupero della replica punto di controllo.
  • Puoi creare uno snapshot dal checkpoint di recupero della replica solo utilizzando l'API Compute Engine.

Passaggi successivi