Informazioni sulla replica asincrona dei dischi permanenti


La replica asincrona del disco permanente (PD Async Replication) fornisce una replica dell'archiviazione a blocchi con RPO (Recovery Point Objective) e RTO (Recovery Time Objective) bassi per il ripristino di emergenza (RE) attivo-passivo tra regioni.RPORTO

La replica asincrona del disco permanente è un'opzione di archiviazione che fornisce la replica asincrona di dati tra due regioni. Nell'improbabile caso di un'interruzione in una regione, la replica asincrona del disco permanente consente di eseguire il failover dei dati in una regione secondaria e di riavviare il carico di lavoro in quella regione.

Puoi utilizzare la replica asincrona di PD per gestire la replica per i workload di Compute Engine a livello di infrastruttura anziché a livello di workload.

Panoramica

La replica asincrona del disco permanente replica i dati da un disco collegato a un carico di lavoro in esecuzione, il disco principale, a un disco separato situato in un'altra regione. Il disco che riceve i dati replicati è denominato disco secondario.

La regione in cui si trova il disco principale è regione principale, mentre la regione in cui si trova il disco secondario è regione secondaria. Le regioni principali e secondarie vengono chiamate coppia di regioni.

Qualsiasi disco che soddisfi i requisiti del disco può essere utilizzato come disco principale. Dopo aver creato un disco principale, puoi creare un disco secondario che fa riferimento al disco principale e avviare la replica dal disco principale al disco secondario.

Se interrompi la replica dal disco principale in un determinato momento e vuoi riavviare la replica in un secondo momento, devi creare un nuovo disco secondario per riavviare la replica.

Gruppi con coerenza

I gruppi di coerenza ti consentono di eseguire test di ripristino di emergenza (RE) su più dischi. Un gruppo di coerenza è un criterio delle risorse che svolge quanto segue:

  • Allinea la replica sui dischi principali e garantisce che tutti i dischi contengano dati di replica di un punto in tempo comune, che vengono utilizzati per RE.
  • Allinea i cloni dei dischi dai dischi secondari e garantisce che tutti i cloni dei dischi contengano dati di un momento specifico comune, che viene utilizzato per le esercitazioni di RE.

Se vuoi allineare il periodo di replica su più dischi, aggiungi i dischi primari a un gruppo di coerenza. Se vuoi clonare più dischi e assicurarti che i dati dei cloni risalgano a un momento specifico comune, aggiungi i dischi secondari a un gruppo di coerenza. Un gruppo di coerenza può essere utilizzato per la replica o la clonazione, ma non per entrambe contemporaneamente.

Se vuoi aggiungere dischi principali a un gruppo di coerenza, devi aggiungere i dischi al gruppo di coerenza prima di avviare la replica. Puoi aggiungere dischi secondari a un gruppo di coerenza in qualsiasi momento.

Failover e failback

In caso di interruzione nella regione principale, è tua responsabilità identificare l'interruzione ed eseguire il failover per riavviare il carico di lavoro utilizzando i dischi secondari nella regione secondaria. La replica asincrona di PD non offre il monitoraggio delle interruzioni del servizio. Puoi identificare un'interruzione utilizzando metriche RPO, controlli di integrità, metriche specifiche dell'applicazione e contattando l'assistenza clienti Google Cloud.

La procedura di failover prevede le seguenti attività:

  1. Interrompi la replica.
  2. Collega i dischi secondari alle VM nella regione secondaria.

Dopo aver eseguito il failover dei dischi, è tua responsabilità convalidare e riavviare il workload dell'applicazione nella regione secondaria e riconfigurare gli indirizzi di rete utilizzati per accedere all'applicazione in modo che puntino alla regione secondaria.

A seguito di un failover dalla regione principale alla regione secondaria, la regione secondaria diventa la regione principale effettiva. Una volta risolto l'interruzione o il disastro, puoi avviare il failback per iniziare la replica dalla regione secondaria originale (la regione principale in funzione) alla regione principale originale. Se vuoi, puoi ripetere la procedura per spostare nuovamente il workload nella regione principale originale.

La procedura di failback prevede le seguenti attività:

  1. Configura la replica tra la nuova regione principale e la regione principale originale.

    • Il disco secondario originale è ora il nuovo disco principale e lo configuri per la replica su un nuovo disco secondario nella regione principale originale.
    • Puoi creare un nuovo criterio di risorse del gruppo di coerenza nella nuova regione primaria in modo che i nuovi dischi principali (i dischi secondari originali) possano essere replicati in modo coerente in un nuovo insieme di dischi secondari nella regione primaria originale.
  2. (Facoltativo) Dopo la replica iniziale, puoi ripetere la procedura di failover per riportare il carico di lavoro nella regione principale originale.

Crittografia del disco

I dischi principali e secondari non supportano le chiavi di crittografia fornite dal cliente (CSEK). Utilizza chiavi di proprietà di Google e gestite da Google o chiavi di crittografia gestite dal cliente (CMEK). Se utilizzi CMEK sul disco principale, devi utilizzarla anche sul disco secondario. Puoi utilizzare CMEK diversi su entrambi i dischi.

Personalizzazione del disco secondario

Quando crei un disco secondario, Compute Engine copia le proprietà del disco primario nel disco secondario. Queste proprietà includono la descrizione, il tipo di disco e le etichette del disco principale.

Se il disco principale è un disco di avvio, anche il disco secondario ha la configurazione di avvio del disco principale. La configurazione di avvio include informazioni sull'architettura del sistema operativo (OS), sulle licenze del sistema operativo e sulle sue funzionalità del sistema operativo guest.

Puoi modificare alcune proprietà del disco secondario in modo che differiscano da quelle del disco principale. Ad esempio, i dischi principali e secondari devono avere le stesse dimensioni e la stessa chiave di crittografia, ma puoi assegnare etichette aggiuntive al disco secondario.

Per i dischi di avvio, puoi attivare opzioni di sicurezza o di rete aggiuntive sul disco secondario specificando funzionalità aggiuntive del sistema operativo guest. Tuttavia, non puoi rimuovere alcuna funzionalità del sistema operativo guest del disco principale. Compute Engine unisce le nuove funzionalità specificate con le funzionalità del sistema operativo guest esistenti del disco principale.

Esempio

Supponiamo che tu abbia un disco di avvio denominato disk-1 con le seguenti funzionalità del sistema operativo guest: [GVNIC, UEFI_COMPATIBLE].

Se crei un disco secondario da disk-1, puoi specificare solo funzionalità aggiuntive. Non puoi rimuovere le funzionalità UEFI_COMPATIBLE e GVNIC. Pertanto, se specifichi MULTI_IP_SUBNET quando crei il disco secondario, la nuova funzionalità viene unita a quelle del disco principale, pertanto le funzionalità del sistema operativo guest risultanti per il disco secondario sono GVNIC, UEFI_COMPATIBLE e MULTI_IP_SUBNET.

Per scoprire come personalizzare un disco secondario, consulta Creare un disco secondario personalizzato.

Replica asincrona dei dischi permanenti e dischi permanenti a livello di regione

Puoi utilizzare la replica asincrona del disco permanente con dischi permanenti regionali per ottenere un'alta disponibilità (HA) e il ripristino di emergenza (RE).

I dischi permanenti a livello di area geografica possono essere utilizzati come disco principale o secondario in una coppia di dischi PD Async Replication. Una coppia di dischi è un disco primario che si replica su un disco secondario.

Quando utilizzi un disco regionale come disco principale, la replica rimane ininterrotta anche se una delle zone presenta un'interruzione. Il disco principale regionale continua a replicare i dati dalla zona sana al disco secondario. Analogamente, quando un disco regionale funge da disco secondario, la replica persiste nonostante un'interruzione in una delle sue zone. L'utilizzo di un disco a livello di area geografica come disco secondario prepara il carico di lavoro per un'elevata disponibilità tra le zone in caso di failover, quando il disco secondario diventa il nuovo disco principale.

Limitazioni

  • La replica asincrona del disco permanente è supportata solo per dischi permanenti bilanciati e per le prestazioni (SSD).
  • I dischi di sola lettura e i dischi multi-writer non sono supportati.
  • Ogni disco può avere una dimensione massima di 32 TiB.
  • Devi interrompere la replica prima di poter eliminare un disco principale o secondario.
  • Se la replica è in corso per il disco di avvio di una VM, non puoi eliminare la VM finché non interrompi la replica.
  • Se un disco principale è collegato a una VM come disco non di avvio e il disco è configurato per essere eliminato con la VM, non puoi eliminare la VM o il disco finché non interrompi la replica o scolleghi il disco principale dalla VM. I tentativi di eliminazione della VM non andranno a buon fine finché non interrompi la replica.
  • Ogni progetto può avere al massimo 1000 coppie di dischi in ogni coppia di regioni.

    Ad esempio, un determinato progetto, project-1, può avere fino a 1000 coppie di dischi nella coppia di regioni Iowa-Oregon. project-1 può anche avere fino a 1000 coppie di dischi nella coppia di regioni Belgio-Francoforte.

Aree geografiche supportate

La replica asincrona dei dischi permanenti è disponibile in tutte le regioni dei seguenti continenti:

  • Asia, ad eccezione dell'Indonesia
  • Europa
  • Nord America
  • Oceania

Puoi replicare un disco principale in una determinata regione su un disco secondario in qualsiasi regione disponibile all'interno dello stesso continente. Ciò significa che puoi creare una coppia di regioni da qualsiasi coppia di regioni all'interno dello stesso continente.

Ad esempio, supponiamo che tu abbia un disco principale a Francoforte (europe-west3). Puoi replicare questo disco su un disco secondario in qualsiasi parte d'Europa, ma non puoi replicarlo in una regione del Nord America.

Per un elenco completo di tutte le regioni in Compute Engine, consulta Zone e regioni disponibili.

Prestazioni

L'obiettivo del punto di ripristino (RPO) o il ritardo di tempo per cui i dati sono disponibili nel sito secondario dipende dalle frequenze di modifica del disco. La replica asincrona del disco permanente in genere replica i dati con un RPO target di un minuto, per un massimo di 12,5 GB di blocchi modificati compressi al minuto con blocchi di disco replicati con una granularità di blocco di 4 KB. Se un determinato blocco viene modificato più volte tra gli eventi di replica, solo la modifica più recente viene replicata sul disco secondario. A tassi di modifica del disco più elevati, il RPO può essere superiore a un minuto e in genere aumenta con l'aumento dei tassi di modifica del disco. Il RPO non è configurabile.

Il RPO potrebbe superare un minuto nei seguenti scenari:

  • Quando inizia la replica del disco. Durante la replica iniziale, la replica asincrona dei PD replica tutti i blocchi utilizzati sul disco principale sul disco secondario. La replica iniziale è completata quando la metrica disk/async_replication/time_since_last_replication è disponibile in Cloud Monitoring.
  • Se la frequenza di modifica del disco è superiore a 12,5 GB di blocchi modificati compressi al minuto. Dopo un picco di modifiche al disco, l'RPO per i cicli di replica successivi potrebbe superare un minuto mentre la replica si aggiorna.
  • Se scolleghi un disco da una VM o riavvii una VM mentre il disco è in fase di replica. I dischi in fase di replica e scollegati da una VM potrebbero registrare un aumento dell'RPO fino a cinque minuti per un breve periodo di tempo.

Per scoprire come visualizzare il RPO per i tuoi dischi, consulta Metriche sul rendimento della replica asincrona dei dischi permanenti.

L'obiettivo di tempo di recupero (RTO) durante il failover dipende dal tempo necessario per completare le varie attività necessarie per eseguire il failover del carico di lavoro in una nuova regione. Attività come l'interruzione della replica e l'aggancio dei dischi alle VM nella regione secondaria dovrebbero richiedere solo pochi minuti. Puoi velocizzare il RTO assicurandoti di avere VM in esecuzione nella regione secondaria, in modo che, in caso di failover, non debba attendere l'avvio delle VM.

Passaggi successivi