Informazioni sulla replica asincrona dei dischi permanenti


La replica asincrona del disco permanente (PD Async Replication) fornisce una replica dell'archiviazione a blocchi con RPO (Recovery Point Objective) e RTO (Recovery Time Objective) bassi per il ripristino di emergenza (RE) attivo-passivo tra regioni.

La replica asincrona PD è un'opzione di archiviazione che fornisce la replica asincrona di dati tra due regioni. Nell'improbabile caso di interruzione del servizio a livello di regione, La replica asincrona PD consente di eseguire il failover dei dati in una regione secondaria riavvia il carico di lavoro in quella regione.

Puoi utilizzare la replica asincrona di PD per gestire la replica per i carichi di lavoro Compute Engine a livello di infrastruttura anziché a livello di carico di lavoro.

Panoramica

La replica asincrona del disco permanente replica i dati da un disco collegato a un per il carico di lavoro, il disco primario, su un disco separato situato in un'altra regione. Il disco che riceve i dati replicati è definito disco secondario.

La regione in cui si trova il disco primario è indicata come regione principale e regione in cui si trova il disco secondario in cui si trova è definita regione secondaria. L'account principale e secondario regioni sono definite coppia di regioni.

Qualsiasi disco che soddisfi i requisiti del disco può essere utilizzato come disco principale. Dopo aver creato un disco primario, puoi crea un disco secondario che fa riferimento al disco primario avvia replica dal disco primario a quello secondario.

Se interrompi la replica dal disco primario in qualsiasi momento e vuoi riavviare replicare in un secondo momento, devi creare un nuovo disco secondario riavvia la replica.

Gruppi con coerenza

I gruppi di coerenza ti consentono di eseguire test di ripristino di emergenza (DR) su più dischi. Un gruppo di coerenza è un criterio delle risorse che svolge quanto segue:

  • Allinea la replica sui dischi principali e garantisce che tutti i dischi contengano dati di replica di un punto in tempo comune, che vengono utilizzati per il DR.
  • Allinea i cloni di dischi dei dischi secondari e garantisce che tutti i dischi cloni contengono dati relativi a un momento comune, che viene utilizzato per le esercitazioni di RE.

Se vuoi allineare il periodo di replica su più dischi, aggiungi il cluster principale i dischi permanenti a un gruppo di coerenza. Se vuoi clonare più dischi e assicurarti che i cloni dispongano di dati di un momento comune, aggiungi i dischi permanenti a un gruppo di coerenza. Un gruppo di coerenza può essere utilizzato di replica o clonazione, ma non entrambe contemporaneamente.

Se vuoi aggiungere dischi principali a un gruppo di coerenza, devi aggiungere i dischi al gruppo di coerenza prima di avviare la replica. Puoi aggiungere dischi secondari a un gruppo di coerenza in qualsiasi momento.

Failover e failback

In caso di interruzione nella regione principale, è tua responsabilità per identificare l'interruzione e il failover, riavvia il carico di lavoro utilizzando dei dischi permanenti nella regione secondaria. La replica asincrona del disco permanente non offre il monitoraggio delle interruzioni del servizio. Puoi identificare un'interruzione utilizzando metriche RPO, controlli di integrità, metriche specifiche dell'applicazione e contattando l'assistenza clienti di Cloud.

La procedura di failover prevede le seguenti attività:

  1. Interrompi la replica.
  2. Collega i dischi secondari alle VM nella regione secondaria.

Dopo aver eseguito il failover dei dischi, è tua responsabilità convalidare e riavviare del carico di lavoro delle applicazioni nella regione secondaria e riconfigurare la rete indirizzi utilizzati per accedere alla tua applicazione in modo che puntino alla regione secondaria.

A seguito di un failover dalla regione principale alla regione secondaria, la regione secondaria diventa la regione principale effettiva. Dopo l'interruzione o il disastro viene risolto, puoi avviare il failover per avviare la replica regione secondaria originale (la regione principale di recitazione) alla regione principale originale regione. Facoltativamente, puoi ripetere il processo per riportare il carico di lavoro allo regione principale originale.

La procedura di failback prevede le seguenti attività:

  1. Configura la replica tra la nuova regione principale e quella originale regione principale.

    • Il disco secondario originale è ora il nuovo disco principale e lo configuri per la replica su un nuovo disco secondario nella regione principale originale.
    • Puoi creare un nuovo criterio di risorse del gruppo di coerenza nella nuova regione primaria in modo che i nuovi dischi principali (i dischi secondari originali) possano essere replicati in modo coerente in un nuovo insieme di dischi secondari nella regione primaria originale.
  2. (Facoltativo) Dopo la replica iniziale, puoi ripetere la procedura di failover per riportare il carico di lavoro nella regione principale originale.

Crittografia del disco

I dischi primari e secondari non supportano le chiavi di crittografia fornite dal cliente (CSEK). Utilizza le funzionalità di Chiavi di proprietà di Google e gestite da Google oppure chiavi di crittografia gestite dal cliente (CMEK) . Se utilizzi CMEK sul disco principale, devi utilizzarla anche sul disco secondario. Puoi utilizzare CMEK diverse su entrambi i dischi.

Personalizzazione del disco secondario

Quando crei un disco secondario, quest'ultimo eredita le proprietà del disco primario, come descrizione, tipo di disco etichette. Se il disco primario è un disco di avvio, il disco secondario eredita la configurazione di avvio del disco primario. Lo stivale include informazioni sull'architettura del sistema operativo, Licenze del sistema operativo e relative funzionalità del sistema operativo ospite.

Puoi modificare alcune proprietà del disco secondario in modo che differiscano da quelle del disco principale. Ad esempio, il disco primario e quello secondario devono avere lo stesso dimensione e chiave di crittografia, ma potresti assegnare altre etichette al disco secondario.

Per i dischi di avvio, puoi attivare opzioni di sicurezza o di rete aggiuntive sul disco secondario specificando funzionalità aggiuntive del sistema operativo guest. Tuttavia, non puoi Rimuovere tutte le funzionalità del sistema operativo guest del disco primario. Compute Engine unisce le nuove funzionalità specificate con le funzionalità del sistema operativo guest esistenti del disco principale.

Esempio

Supponiamo che tu abbia un disco di avvio denominato disk-1 con le seguenti funzionalità del sistema operativo guest: [GVNIC, UEFI_COMPATIBLE].

Se crei un disco secondario da disk-1, puoi specificare solo funzionalità aggiuntive. Non puoi rimuovere le funzionalità UEFI_COMPATIBLE e GVNIC. Pertanto, se specifichi MULTI_IP_SUBNET quando crei il disco secondario, la nuova funzionalità viene unita a quelle del disco principale, pertanto le funzionalità del sistema operativo guest risultanti per il disco secondario sono GVNIC, UEFI_COMPATIBLE e MULTI_IP_SUBNET.

Per scoprire come personalizzare un disco secondario, consulta Creare un disco secondario personalizzato.

Replica asincrona dei dischi permanenti e dischi permanenti a livello di regione

Puoi utilizzare la replica asincrona del disco permanente con dischi permanenti regionali per ottenere un'alta disponibilità (HA) e il ripristino di emergenza (RE).

I dischi permanenti a livello di area geografica possono essere utilizzati come disco principale o secondario in una coppia di dischi PD Async Replication. Una coppia di dischi è un disco primario viene replicato su un disco secondario.

Quando utilizzi un disco regionale come disco principale, la replica rimane ininterrotta anche se una delle zone presenta un'interruzione. Il disco principale regionale continua a replicare i dati dalla zona sana al disco secondario. Analogamente, quando un disco regionale funge da disco secondario, la replica persiste nonostante un'interruzione in uno dei suoi zone. L'utilizzo di un disco regionale come disco secondario prepara il carico di lavoro la disponibilità tra zone in caso di failover, in cui il disco secondario per diventare il nuovo disco primario.

Limitazioni

  • La replica asincrona PD è supportata solo per Persistent Disk con bilanciamento delle prestazioni e prestazioni (SSD).
  • I dischi di sola lettura e i dischi multi-writer non sono supportati.
  • Ogni disco può avere una dimensione massima di 32 TiB.
  • Ogni progetto può avere al massimo 1000 coppie di dischi in ogni coppia di regioni.

    Ad esempio, un determinato progetto, project-1 può avere al massimo 1000 coppie di dischi nella regione Iowa-Oregon . project-1 può anche avere fino a 1000 coppie di dischi nella coppia di regioni Belgio-Francoforte.

Aree geografiche supportate

La replica asincrona dei dischi permanenti è disponibile in tutte le regioni dei seguenti continenti:

  • Asia, ad eccezione dell'Indonesia
  • Europa
  • Nord America
  • Oceania

Puoi replicare un disco principale in una determinata regione su un disco secondario in qualsiasi regione disponibile all'interno dello stesso continente. Ciò significa che puoi creare una coppia di regioni da due regioni all'interno dello stesso continente.

Ad esempio, supponiamo che tu abbia un disco primario a Francoforte (europe-west3). Puoi replicare quel disco su un disco secondario ovunque in Europa, ma non puoi replicarli in una regione del Nord America.

Per un elenco completo di tutte le regioni in Compute Engine, consulta Regioni e zone disponibili.

Prestazioni

Il Recovery Point Objective (RPO) o il ritardo nella disponibilità dei dati nel sito secondario, dipende dalla velocità di cambio del disco. La replica asincrona PD replica in genere i dati con un RPO target di un minuto, per un massimo di 12,5 GB di blocchi modificati al minuto compressi con di blocchi di disco replicati con una granularità dei blocchi di 4 kB. Se un determinato blocco viene cambiato più volte tra un evento di replica e l'altro, solo la modifica più recente viene replicato sul disco secondario. A tassi di modifica del disco più elevati, il RPO può essere superiore a un minuto e in genere aumenta con l'aumento dei tassi di modifica del disco. RPO non è configurabile.

Il RPO potrebbe superare un minuto nei seguenti scenari:

  • Quando viene avviata la replica del disco. Durante la replica iniziale, La replica asincrona PD replica tutti i blocchi utilizzati sul disco primario nella disco secondario. La replica iniziale è completa quando Metrica disk/async_replication/time_since_last_replication è disponibile in Cloud Monitoring.
  • Se la frequenza di cambio del disco è superiore a 12,5 GB di dati compressi modificati blocchi al minuto. Dopo un picco di modifiche del disco, l'RPO per i cicli di replica potrebbero superare un minuto durante il recupero.
  • Se scolleghi un disco da una VM o riavvii una VM mentre il disco è in fase di replica. Dischi in fase di replica scollegati da un La VM potrebbe registrare un aumento dell'RPO fino a cinque minuti per un breve periodo di tempo.

Per scoprire come visualizzare l'RPO per i tuoi dischi, consulta Metriche sulle prestazioni della replica asincrona del disco permanente.

L'obiettivo di tempo di recupero (RTO) durante il failover dipende dal tempo necessario per completare le varie attività necessarie per eseguire il failover del carico di lavoro in una nuova regione. Attività come l'interruzione della replica e l'aggancio dei dischi alle VM nella regione secondaria dovrebbero richiedere solo pochi minuti. Puoi velocizzare il RTO assicurandoti di avere VM in esecuzione nella regione secondaria, in modo che, in caso di failover, non debba attendere l'avvio delle VM.

Passaggi successivi