Informazioni sulla replica dei dischi sincroni


Il disco permanente regionale e l'alta disponibilità Hyperdisk bilanciata sono opzioni di archiviazione che consentono di implementare ad alta disponibilità in Compute Engine. Il disco permanente regionale e l'alta disponibilità Hyperdisk bilanciata replicano in modo sincrono i dati tra due nella stessa regione e garantire l'alta disponibilità per i dati del disco per un massimo di a livello di zona.

I volumi disco permanente regionale e Hyperdisk ad alta disponibilità bilanciati sono progettati per carichi di lavoro richiedono un RPO (Recovery Point Objective) e un Recovery Time Objective (RPO) più bassi (RTO). Per scoprire di più su RPO e RTO, consulta Nozioni di base sulla pianificazione del ripristino di emergenza.

I volumi con alta disponibilità bilanciata di Hyperdisk e disco permanente regionale sono progettati per funzionare con i gruppi di istanze gestite a livello di regione.

Questo documento fornisce una panoramica su come creare servizi ad alta disponibilità con Volumi permanenti a livello di regione e Hyperdisk bilanciati ad alta disponibilità.

Quando decidi di utilizzare un disco permanente regionale o una disponibilità elevata con Hyperdisk Balanced, Confrontare le diverse opzioni per aumentare la disponibilità del servizio costi, prestazioni e resilienza per diverse architetture di servizio.

Informazioni sulla replica sincrona dei dischi

Un volume Hyperdisk bilanciato ad alta disponibilità (anteprima) o disco permanente regionale, chiamato anche disco replicato, ha una zona principale e una secondaria all'interno della regione in cui memorizza i dati del disco:

  • La zona principale è la stessa in cui si trova l'istanza di calcolo a cui colleghi il disco.
  • Zona secondaria è una zona alternativa a tua scelta all'interno della stessa regione.

Compute Engine gestisce le repliche del disco in entrambe queste zone. Quando scrivi dati sul disco, Compute Engine li replica in modo sincrono nelle repliche del disco in entrambe le zone per garantire l'HA. I dati di ciascuna replica a livello di zona è distribuita su più macchine fisiche all'interno per garantirne la durabilità. Le repliche di zona assicurano che i dati il disco rimane disponibile e offre protezione o in caso di interruzione del servizio in una delle zone del disco.

Stato della replica per le repliche a livello di zona

Stato replica disco per Disco permanente regionale o disponibilità elevata con Hyperdisk Bilanciato (Anteprima) mostra lo stato a una replica a livello di zona rispetto al contenuto del disco. Le repliche a livello di zona per i tuoi dischi sono sempre in uno dei seguenti stati:

  • Sincronizzata: la replica è disponibile, riceve tutte le scritture in modo sincrono eseguito sul disco ed è aggiornato con tutti i dati presenti sul disco.
  • Recupero: la replica è disponibile, ma sta ancora tentando di recuperare i dati sul disco dall'altra replica.
  • Non sincronizzata: la replica è temporaneamente non disponibile e non sincronizzata. con i dati sul disco.

Per scoprire come controllare e monitorare gli stati delle repliche zonali, consulta Monitorare gli stati delle repliche dei dischi.

Stati di replica per dischi replicati in modo sincrono

A seconda dello stato delle singole repliche a livello di zona, Disco permanente regionale o disponibilità elevata con Hyperdisk Bilanciato (Anteprima) il volume può essere in uno di i seguenti stati di replica:

  • Completamente replicato: le repliche in entrambe le zone sono disponibili e vengono sincronizzate con i dati più recenti del disco.
  • Aggiornamento: le repliche a livello di zona sono disponibili, ma una delle di repliche si sta mettendo al passo con i dati del disco più recenti.
  • Compromissione:una delle repliche a livello di zona ha lo stato out of sync a causa di un errore o un'interruzione del servizio.

Se lo stato della replica del disco è catching up o degraded, una delle repliche a livello di zona non è aggiornata con tutti i dati. Qualsiasi interruzione durante questo periodo nella zona della replica sana comporta l'impossibilità di utilizzare il disco fino al ripristino della zona della replica sana.

Quando il tuo Il volume dei dischi permanenti a livello di regione o a disponibilità elevata con iperdisco bilanciato è in fase di recupero, Google Cloud inizia a riparare la replica a livello di zona che sta controllando. Google consiglia di attendere che la replica zonale interessata raggiunga i dati sul disco, a quel punto il suo stato diventa Synced. Dopo che la replica a livello di zona passa allo stato sincronizzato, lo stato del disco replicato torna allo stato Fully replicated.

Se lo stato del disco replicato è catching up o degraded per un per un periodo di tempo prolungato e non soddisfa i requisiti RPO della tua organizzazione, ti consigliamo di acquisire snapshot della replica principale in uno dei nei seguenti modi:

  • Abilita snapshot pianificati.
  • Crea uno snapshot manuale del disco permanente regionale o del disco Hyperdisk ad alta disponibilità bilanciata.

Dopo aver creato uno snapshot, puoi crearne uno nuovo un disco permanente regionale o un disco a disponibilità elevata bilanciata con Hyperdisk utilizzando snapshot come origine. Lo snapshot viene ripristinato sul nuovo disco. Anche il nuovo disco inizia in uno stato completamente replicato con una replica dei dati corretta.

Per scoprire come controllare lo stato di replica del tuo Disco permanente regionale o disco a disponibilità elevata bilanciata con Hyperdisk, consulta Determina lo stato di replica dei dischi.

Checkpoint di recupero della replica

Un controllo punto di ripristino della replica è un attributo del disco che rappresenta il punto in tempo coerente con gli arresti anomali più recente di un disco completamente replicato. Compute Engine crea automaticamente e mantiene un singolo checkpoint di recupero della replica per ogni disco replicato. Quando un disco viene completamente replicato, Compute Engine continua ad aggiornare il checkpoint circa ogni 10 minuti per il checkpoint rimane aggiornato. Quando lo stato della replica del disco è degraded, Compute Engine ti consente di creare uno snapshot standard dal checkpoint di recupero della replica del disco. Lo snapshot standard risultante acquisisce i dati dalla versione più recente del disco completamente replicato in caso di arresto anomalo.

In rari casi, quando il disco è in stato di degrado, anche la replica zonale sincronizzata con i dati più recenti del disco può non riuscire prima che la replica non sincronizzata venga aggiornata. Non potrai forzare l'associazione del disco a di calcolo delle istanze in una delle zone. Il disco replicato non è più disponibile e devi migrare i dati su un nuovo disco. In questi scenari, se non disponi di snapshot standard esistenti per il disco, potresti comunque riuscire a recuperarlo i dati della replica incompleta utilizzando uno snapshot standard creato dal checkpoint di recupero della replica.

Compute Engine crea automaticamente i checkpoint di recupero delle repliche per ogni disco permanente regionale o Hyperdisk ad alta disponibilità bilanciata (anteprima) montato. Non ti viene addebitato alcun costo costi aggiuntivi per la creazione di questi posti di blocco. Tuttavia, ti verranno addebitati eventuali costi di archiviazione applicabili per la creazione di snapshot e istanze di calcolo quando utilizzi questi checkpoint per eseguire la migrazione del disco replicato alle zone di funzionamento.

Scopri di più su come recuperare i dati del disco replicato utilizzando un checkpoint di recupero della replica.

Failover dei dischi replicati

In caso di interruzione di una zona, quest'ultima diventa inaccessibile e Compute in quella zona non può eseguire operazioni di lettura o scrittura disco. Per consentire all'istanza di continuare a eseguire operazioni di lettura e scrittura per il disco replicato, Compute Engine consente la migrazione dei dati del disco all'altra zona in cui il disco ha una replica. Questo processo è noto come failover.

Il processo di failover prevede lo scollegamento della replica zonale dall'istanza nella zona interessata e il successivo collegamento della replica zonale a una nuova istanza nella zona secondaria. Compute Engine esegue la replica sincrona dei dati sul disco nella zona secondaria per garantire un rapido failover in caso di errore di una singola replica.

Failover in base al control plane regionale specifico dell'applicazione

Il piano di controllo a livello di regione specifico per l'applicazione non è un servizio Google Cloud. Quando progetti architetture di servizi ad alta disponibilità, devi creare il tuo control plane regionale specifico per l'applicazione. Questo piano di controllo delle applicazioni decide a quale istanza deve essere collegato il disco replicato è l'istanza principale attuale.

Quando viene rilevato un errore nell'istanza o nel database principale di sul disco replicato, il piano di controllo regionale specifico per l'applicazione della tua architettura del servizio ad alta disponibilità può avviare automaticamente in standby nella zona secondaria. Durante il failover, il piano di controllo regionale specifico per l'applicazione ricollega il disco replicato all'istanza in standby nella zona secondaria. Compute Engine indirizza quindi tutti a quella istanza in base agli indicatori del controllo di integrità.

La latenza complessiva del failover, escluso il tempo di rilevamento degli errori, è la somma delle seguenti latenze:

  • Meno di 1 minuto per collegare un disco replicato a un'istanza di standby
  • Tempo necessario per l'inizializzazione dell'applicazione e il recupero in caso di arresto anomalo

Per ulteriori informazioni, vedi Informazioni sul piano di controllo regionale specifico per l'applicazione.

La pagina Componenti di base per il ripristino di emergenza descrive i componenti di base disponibili su Compute Engine.

Failover tramite collegamento forzato

Uno dei vantaggi di Regional Persistent Disk e Hyperdisk Balanced High Availability (anteprima) è che nell'improbabile caso di un'interruzione in una zona, puoi eseguire manualmente il failover del carico di lavoro in un'altra zona. Quando la zona originale è in stato di interruzione, non puoi completare l'operazione di scollegamento del disco finché la replica a livello di zona non viene ripristinata. In questo scenario, potrebbe essere necessario collegare la replica zonale secondaria a una nuova istanza di calcolo senza scollegare la replica zonale principale dall'istanza principale. Questa procedura è chiamata force-attach.

Quando l'istanza Compute nella zona principale non è più disponibile, puoi per forzare il collegamento del disco a un'istanza nella zona secondaria. Per eseguire questa attività, devi eseguire una delle seguenti operazioni:

  • Avvia un'altra istanza di calcolo nella stessa zona del disco replicato che stai collegando forzatamente.
  • Mantieni un'istanza di computing in hot standby in quella zona. Un hot standby è un in esecuzione uguale a quella nella zona principale. I due contengono gli stessi dati.

Compute Engine esegue l'operazione di collegamento forzato in meno di un minuto. L'RTO (Recovery Time Objective) totale dipende non solo dal failover dello spazio di archiviazione (l'attacco forzato del disco replicato), ma anche da altri fattori, tra cui:

  • Se devi prima creare un'istanza secondaria
  • Il tempo impiegato dal file system sottostante per rilevare un disco collegato a caldo
  • Il tempo di ripristino delle applicazioni corrispondenti

Per saperne di più su come eseguire il failover dell'istanza Compute utilizzando Forza collegamento, vedi Failover del disco replicato utilizzando force-attach.

Il disco permanente regionale e l' alta disponibilità con iperdisco bilanciato favoriscono il carico di lavoro il che comporta alcuni compromessi per quanto riguarda la protezione dei dati è improbabile che entrambe le repliche del disco non siano disponibili contemporaneamente. Per ulteriori informazioni, vedi Gestione degli errori per i dischi replicati.

Limitazioni

Le seguenti sezioni elencano le limitazioni che si applicano Disco permanente regionale e disponibilità elevata con Hyperdisk bilanciato (anteprima).

Limitazioni generali per i dischi replicati

  • È possibile collegare un disco permanente regionale solo alle macchine virtuali che utilizzano come machine family E2, N1, N2 e N2D.
  • Puoi collegare l'alta disponibilità Hyperdisk Balanced solo ai supporti tipi di macchine.
  • Non puoi creare un disco permanente di una regione da un'immagine o da un disco creato da un'immagine.
  • Quando utilizzi la modalità di sola lettura, puoi collegare un Persistent Disk bilanciato a livello di regione a un massimo di 10 di istanze VM di Compute Engine.
  • La dimensione minima di un disco permanente standard a livello di regione è 200 GiB.
  • Puoi solo aumentare le dimensioni di un disco permanente regionale o volume Hyperdisk bilanciato ad alta disponibilità; non puoi ridurle.
  • I volumi di disco permanente regionale e iperdisco bilanciato ad alta disponibilità hanno prestazioni diverse rispetto ai dischi di zona corrispondenti. Per ulteriori informazioni, vedi Blocca le prestazioni dello spazio di archiviazione.
  • Non puoi utilizzare un volume Hyperdisk bilanciato con disponibilità elevata in modalità multi-writer come disco di avvio.
  • Se crei un disco replicato clonando un disco a livello di zona, le due repliche non sono completamente sincronizzati al momento della creazione. Dopo la creazione, puoi utilizzare la copia del disco regionale in media entro 3 minuti. Tuttavia, potresti dover attendere decine di minuti prima che il disco raggiunga uno stato completamente replicato e il Recovery Point Objective (RPO) sia vicino allo zero. Scopri come verifica che il disco replicato sia completamente replicato.

Limitazioni per i checkpoint di recupero delle repliche

  • Un checkpoint di recupero della replica fa parte dei metadati del dispositivo e non mostra da solo i dati del disco. Il checkpoint può essere utilizzato solo come meccanismo crea uno snapshot del disco con prestazioni ridotte. Dopo aver creato lo snapshot utilizzando il checkpoint, puoi utilizzarlo per ripristinare i dati.
  • Puoi creare snapshot da un checkpoint di recupero della replica solo quando il disco le prestazioni sono ridotte.
  • Compute Engine aggiorna il checkpoint di recupero della replica del disco solo quando completamente replicato.
  • Compute Engine mantiene solo un checkpoint di recupero della replica per un disco gestisce solo l'ultima versione di quel checkpoint.
  • Non puoi visualizzare i timestamp esatti di creazione e aggiornamento di un recupero della replica punto di controllo.
  • Puoi creare uno snapshot dal checkpoint di recupero della replica solo utilizzando l'API Compute Engine.

Passaggi successivi