Informazioni sulla replica asincrona del disco permanente

La replica asincrona del disco permanente (PD Async Replication) offre un RPO (Recovery Point Objective) basso (RPO) e un low Recovery Time Objective (RTO) per la replica di archiviazione a blocchi per il ripristino di emergenza attivo-passivo (RE) tra regioni.

La replica asincrona dei DP è un'opzione di archiviazione che fornisce la replica asincrona dei dati tra due regioni. Nell'improbabile eventualità di un'interruzione a livello di regione, la replica asincrona di DP consente di eseguire il failover dei dati in una regione secondaria e di riavviare il carico di lavoro in quella regione.

Puoi utilizzare la replica asincrona DP per gestire la replica dei carichi di lavoro di Compute Engine a livello di infrastruttura, anziché a livello di carico di lavoro.

Panoramica

La replica asincrona del disco permanente replica i dati da un disco collegato a un carico di lavoro in esecuzione, il disco primario, su un disco separato situato in un'altra regione. Il disco che riceve i dati replicati è indicato come disco secondario.

La regione in cui si trova il disco principale è indicata come regione principale, mentre quella in cui si trova il disco secondario è indicata come regione secondaria. Le regioni principali e secondarie sono definite coppia di regioni.

Qualsiasi disco che soddisfi i requisiti del disco può essere utilizzato come disco primario. Dopo aver ottenuto un disco primario, puoi creare un disco secondario che faccia riferimento al disco primario e avviare la replica dal disco primario al disco secondario.

Se interrompi la replica dal disco primario in qualsiasi momento e vuoi riavviarla in un secondo momento, devi creare un nuovo disco secondario per riavviarla.

Gruppi con coerenza

I gruppi di coerenza consentono di eseguire test di ripristino di emergenza (RE) e RE su più dischi. Un gruppo di coerenza è un criterio delle risorse che:

  • Allinea la replica sui dischi primari e garantisce che tutti i dischi contengano dati di replica provenienti da un momento specifico comune, utilizzato per RE.
  • Allinea i cloni dei dischi dai dischi secondari e garantisce che tutti i cloni dei dischi contengano dati di un momento specifico comune, utilizzato per i drill di RE.

Se vuoi allineare il periodo di replica su più dischi, aggiungi i dischi primari a un gruppo di coerenza. Se vuoi clonare più dischi e assicurarti che i cloni abbiano dati di un momento specifico, aggiungi dischi secondari a un gruppo di coerenza. È possibile utilizzare un gruppo di coerenza per la replica o la clonazione, ma non per entrambe contemporaneamente.

Se vuoi aggiungere dischi primari a un gruppo di coerenza, devi aggiungere dischi al gruppo di coerenza prima di avviare la replica. Puoi aggiungere dischi secondari a un gruppo di coerenza in qualsiasi momento.

Failover e failover

In caso di interruzione nella regione principale, è tua responsabilità identificare l'interruzione e riavviare il carico di lavoro utilizzando i dischi secondari nella regione secondaria. La replica asincrona DP non offre il monitoraggio delle interruzioni. Puoi identificare un'interruzione utilizzando le metriche RPO, i controlli di integrità, le metriche specifiche dell'applicazione e contattando l'assistenza clienti Google Cloud.

La procedura di failover prevede le seguenti attività:

  1. Arresta la replica.
  2. Collega i dischi secondari alle VM nella regione secondaria.

Dopo aver eseguito il failover dei dischi, è tua responsabilità convalidare e riavviare il carico di lavoro dell'applicazione nella regione secondaria e riconfigurare gli indirizzi di rete utilizzati per accedere all'applicazione in modo che puntino alla regione secondaria.

A seguito di un failover dalla regione principale a quella secondaria, la regione secondaria diventa la regione principale interessata. Una volta risolto l'interruzione o l'emergenza, puoi avviare il failover per avviare la replica dalla regione secondaria originale (la regione principale dell'utente) a quella principale. Facoltativamente, puoi ripetere la procedura per riportare il carico di lavoro alla regione principale originale.

La procedura di failover prevede le seguenti attività:

  1. Configura la replica tra la nuova regione principale e la regione principale originale.

    • Il disco secondario originale ora è il nuovo disco primario. Lo puoi configurare in modo che venga replicato su un nuovo disco secondario nella regione principale originale.
    • Puoi creare un nuovo criterio delle risorse del gruppo di coerenza nella nuova regione principale in modo che i nuovi dischi primari (i dischi secondari originali) possano rispondere in modo coerente a un nuovo set di dischi secondari nella regione principale originale.
  2. (Facoltativo) Una volta eseguita la replica iniziale, puoi ripetere il processo di failover per restituire il carico di lavoro alla regione principale originale.

Crittografia del disco

I dischi primari e secondari non supportano chiavi di crittografia fornite dal cliente (CSEK). Utilizza invece chiavi di crittografia gestite da Google o chiavi di crittografia gestite dal cliente (CMEK). Se utilizzi CMEK sul disco primario, devi usare CMEK anche sul disco secondario. Puoi utilizzare CMEK diverse su entrambi i dischi.

Personalizzazione del disco secondario

Quando crei un disco secondario, questo eredita le proprietà del disco primario, come descrizione, tipo di disco e etichette. Se il disco primario è un disco di avvio, il disco secondario eredita la configurazione di avvio del disco primario. La configurazione di avvio include informazioni sull'architettura del sistema operativo, sulle licenze del sistema operativo e sulle sue funzionalità del sistema operativo guest.

Puoi modificare alcune proprietà del disco secondario in modo che siano diverse dal disco primario. Ad esempio, il disco primario e secondario deve avere la stessa dimensione e la stessa chiave di crittografia, ma puoi assegnare etichette aggiuntive al disco secondario.

Per i dischi di avvio, puoi abilitare opzioni di sicurezza o networking aggiuntive sul disco secondario specificando funzionalità aggiuntive del sistema operativo guest. Tuttavia, non puoi rimuovere nessuna delle funzionalità del sistema operativo guest del disco primario. Compute Engine unisce le nuove funzionalità specificate con quelle esistenti del sistema operativo guest del disco primario.

Esempio

Supponi di avere un disco di avvio denominato disk-1, con le seguenti funzionalità del sistema operativo guest: [GVNIC, UEFI_COMPATIBLE].

Se crei un disco secondario da disk-1, puoi specificare solo funzionalità aggiuntive. Non puoi rimuovere le funzionalità UEFI_COMPATIBLE e GVNIC. Quindi, se specifichi MULTI_IP_SUBNET quando crei il disco secondario, la nuova funzionalità viene unita a quelle del disco primario, di conseguenza le funzionalità del sistema operativo guest risultanti per il disco secondario sono GVNIC, UEFI_COMPATIBLE e MULTI_IP_SUBNET.

Per informazioni su come personalizzare un disco secondario, consulta Creare un disco secondario personalizzato.

Replica asincrona DP e dischi permanenti a livello di regione

Puoi utilizzare la replica asincrona DP con i dischi permanenti a livello di regione per ottenere un'alta disponibilità (HA) e il ripristino di emergenza (RE).

I dischi permanenti a livello di regione possono essere utilizzati come disco primario o secondario in una coppia di dischi di replica asincrona dei DP. Una coppia di dischi è un disco primario che si replica su un disco secondario.

Quando un disco di regione viene utilizzato come disco primario, la replica non viene interrotta se si verifica un'interruzione del servizio in una delle zone del disco primario. Il disco primario a livello di regione continua a replicare dalla zona in stato integro al disco secondario.

Quando un disco di regione viene utilizzato come disco secondario, la replica viene messa in pausa in caso di interruzione di una zona del disco secondario. In questo caso, la replica non continua nella zona integro del disco secondario. Tuttavia, l'utilizzo di dischi regionali come dischi secondari può preparare il carico di lavoro per l'alta disponibilità tra zone in caso di failover quando il disco secondario diventa il nuovo disco primario.

Limitazioni

  • La replica asincrona DP è supportata solo per il disco permanente bilanciato e ad alte prestazioni (SSD).
  • I dischi di sola lettura e i dischi multi-writer non sono supportati.
  • Ogni disco può avere una dimensione massima di 32 TiB.
  • Ogni progetto può avere al massimo 1000 coppie di dischi in ogni coppia di regioni.

    Ad esempio, un determinato progetto project-1 può avere fino a 1000 coppie di dischi nella coppia di regioni Iowa-Oregon. project-1 può anche avere fino a 1000 coppie di dischi nella coppia di regioni Belgio-Francoforte.

Aree geografiche supportate

La replica asincrona DP è disponibile in tutte le regioni nei seguenti continenti:

  • Asia, tranne l'Indonesia
  • Europa
  • Nord America
  • Oceania

Puoi replicare un disco primario in una determinata regione su un disco secondario in qualsiasi regione disponibile all'interno dello stesso continente. Ciò significa che puoi creare una coppia di regioni da due regioni qualsiasi dello stesso continente.

Ad esempio, supponi di avere un disco primario a Francoforte (europe-west3). Puoi replicare il disco su un disco secondario ovunque in Europa, ma non puoi replicarlo in una regione del Nord America.

Per un elenco completo di tutte le regioni in Compute Engine, vedi Zone e regioni disponibili.

Prestazioni

L'RPO (Recovery Point Objective) o il ritardo nel momento in cui i dati sono disponibili sul sito secondario dipende dai tassi di cambio del disco. La replica asincrona PD in genere replica i dati con un RPO di destinazione di un minuto, per un massimo di 2 GB di blocchi modificati compressi al minuto con blocchi di dischi replicati con una granularità dei blocchi di 4 kB. Se un determinato blocco viene modificato più volte tra gli eventi di replica, solo la modifica più recente viene replicata sul disco secondario. A velocità di cambio del disco più elevate, l'RPO può essere superiore a un minuto e in genere aumenta all'aumentare delle velocità di cambio del disco. L'RPO non è configurabile.

L'RPO potrebbe superare un minuto nei seguenti scenari:

  • All'avvio della replica del disco. Durante la replica iniziale, la replica asincrona DP replica tutti i blocchi utilizzati sul disco primario nel disco secondario. La replica iniziale è completata quando la metrica disk/async_replication/time_since_last_replication è disponibile in Cloud Monitoring.
  • Se la frequenza di cambio del disco è superiore a 2 GB di blocchi compressi modificati al minuto. Dopo un picco di modifiche al disco, l'RPO per i cicli di replica successivi potrebbe superare un minuto mentre la replica si raggiunge.
  • Se scolleghi un disco da una VM o riavvii una VM durante la replica del disco. I dischi in fase di replica e scollegati da una VM potrebbero notare un aumento dell'RPO fino a cinque minuti per un breve periodo di tempo.

Per informazioni su come visualizzare l'RPO dei dischi, consulta Metriche sulle prestazioni della replica asincrona del disco permanente.

L'RTO (Recovery Time Objective) durante il failover dipende dal tempo necessario per completare le varie attività coinvolte nel mancato superamento del carico di lavoro in una nuova regione. Il completamento delle attività come l'arresto della replica e il collegamento dei dischi alle VM nella regione secondaria dovrebbe richiedere solo pochi minuti. Puoi accelerare l'RTO assicurandoti che le VM siano in esecuzione nella regione secondaria. In questo modo, in caso di failover, non dovrai attendere l'avvio delle VM.

Passaggi successivi