Informazioni sulla replica asincrona del disco permanente

La replica asincrona del disco permanente (PD Async Replication) fornisce una replica dell'archiviazione a blocchi (RPO) con basso Recovery Point Objective (RTO) e un intervallo di archiviazione a blocchi per il ripristino di emergenza attivo-passivo (RE) tra regioni.

La replica asincrona PD è un'opzione di archiviazione che fornisce la replica asincrona dei dati tra due regioni. Nell'improbabile caso di interruzione del servizio a livello di regione, la replica asincrona PD consente di eseguire il failover dei dati in una regione secondaria e riavviare il carico di lavoro in quella regione.

Puoi utilizzare la replica asincrona PD per gestire la replica per i carichi di lavoro di Compute Engine a livello di infrastruttura anziché a livello di carico di lavoro.

Panoramica

La replica asincrona del disco permanente replica i dati da un disco collegato a un carico di lavoro in esecuzione, il disco primario, in un disco separato situato in un'altra regione. Il disco che riceve i dati replicati è definito disco secondario.

La regione in cui si trova il disco primario è detta regione principale, mentre quella in cui si trova il disco secondario è detta regione secondaria. Le regioni principale e secondaria sono definite coppia di regioni.

Qualsiasi disco che soddisfa i requisiti del disco può essere utilizzato come disco primario. Dopo aver acquistato un disco primario, puoi creare un disco secondario che faccia riferimento al disco primario e avviare la replica dal disco primario a quello secondario.

Se interrompi la replica dal disco primario in qualsiasi momento e vuoi riavviare la replica in un secondo momento, devi creare un nuovo disco secondario per riavviare la replica.

Gruppi con coerenza

I gruppi di coerenza consentono di eseguire test di ripristino di emergenza (RE) e RE su più dischi. Un gruppo di coerenza è un criterio delle risorse che:

  • Allinea la replica sui dischi primari e garantisce che tutti i dischi contengano dati di replica di un momento comune, utilizzato per RE.
  • Allinea i cloni di dischi dei dischi secondari e garantisce che tutti i cloni di dischi contengano dati di un momento comune, utilizzato per i drill RE.

Se vuoi allineare il periodo di replica su più dischi, aggiungi i dischi primari a un gruppo di coerenza. Se vuoi clonare più dischi e assicurarti che questi cloni contengano dati di un momento comune, aggiungi dischi secondari a un gruppo di coerenza. Un gruppo di coerenza può essere usato per la replica o la clonazione, ma non per entrambe contemporaneamente.

Se vuoi aggiungere dischi primari a un gruppo di coerenza, devi aggiungerli al gruppo di coerenza prima di avviare la replica. Puoi aggiungere dischi secondari a un gruppo di coerenza in qualsiasi momento.

Failover e failover

In caso di interruzione nella regione principale, è tua responsabilità identificare l'interruzione e riavviare il carico di lavoro utilizzando i dischi secondari nella regione secondaria. La replica asincrona PD non offre il monitoraggio delle interruzioni. Puoi identificare un'interruzione utilizzando metriche RPO, controlli di integrità, metriche specifiche per l'applicazione e contattando l'assistenza clienti Google Cloud.

Il processo di failover prevede le seguenti attività:

  1. Arresta la replica.
  2. Collega i dischi secondari alle VM nella regione secondaria.

Dopo il failover dei dischi, è tua responsabilità convalidare e riavviare il carico di lavoro dell'applicazione nella regione secondaria e riconfigurare gli indirizzi di rete utilizzati per accedere all'applicazione in modo che puntino alla regione secondaria.

A seguito di un failover dalla regione principale a quella secondaria, quest'ultima diventa la regione principale attiva. Una volta risolta l'interruzione o il disastro, puoi avviare il failover per avviare la replica dalla regione secondaria originale (la regione principale attiva) alla regione principale originale. Facoltativamente, puoi ripetere il processo per riportare il carico di lavoro alla regione principale originale.

Il processo di failover prevede le seguenti attività:

  1. Configura la replica tra la nuova regione principale e quella principale originale.

    • Il disco secondario originale è ora il nuovo disco primario e puoi configurarlo per replicarlo in un nuovo disco secondario nella regione principale originale.
    • Puoi creare un nuovo criterio delle risorse del gruppo di coerenza nella nuova regione principale, in modo che i nuovi dischi primari (quelli secondari originali) possano replicare in modo coerente con un nuovo set di dischi secondari nella regione principale originale.
  2. (Facoltativo) Una volta avvenuta la replica iniziale, puoi ripetere il processo di failover per riportare il carico di lavoro alla regione principale originale.

Crittografia del disco

I dischi primari e secondari non supportano chiavi di crittografia fornite dal cliente (CSEK). Utilizza invece le chiavi di proprietà di Google e gestite da Google o le chiavi di crittografia gestite dal cliente (CMEK). Se utilizzi CMEK sul disco primario, devi utilizzare CMEK anche sul disco secondario. Puoi utilizzare CMEK diverse su entrambi i dischi.

Personalizzazione del disco secondario

Quando crei un disco secondario, questo eredita le proprietà del disco primario, come descrizione, tipo di disco ed etichette. Se il disco primario è un disco di avvio, il disco secondario eredita la configurazione di avvio del disco primario. La configurazione di avvio include informazioni sull'architettura del sistema operativo, sulle licenze del sistema operativo e sulle funzionalità del sistema operativo guest.

Puoi modificare alcune proprietà del disco secondario in modo che siano diverse da quelle del disco primario. Ad esempio, il disco primario e secondario devono avere le stesse dimensioni e la stessa chiave di crittografia, ma potresti assegnare etichette aggiuntive al disco secondario.

Per i dischi di avvio, puoi abilitare opzioni aggiuntive di sicurezza o networking sul disco secondario specificando ulteriori funzionalità del sistema operativo guest. Tuttavia, non puoi rimuovere nessuna funzionalità del sistema operativo guest del disco primario. Compute Engine unisce le nuove funzionalità specificate da te con quelle esistenti del sistema operativo guest del disco primario.

Esempio

Supponiamo che tu abbia un disco di avvio chiamato disk-1, con le seguenti funzionalità del sistema operativo guest: [GVNIC, UEFI_COMPATIBLE].

Se crei un disco secondario da disk-1, puoi specificare solo funzionalità aggiuntive. Non puoi rimuovere le funzionalità UEFI_COMPATIBLE e GVNIC. Pertanto, se specifichi MULTI_IP_SUBNET quando crei il disco secondario, la nuova funzionalità viene unita a quelle del disco primario, quindi le funzionalità del sistema operativo guest risultanti per il disco secondario sono GVNIC, UEFI_COMPATIBLE e MULTI_IP_SUBNET.

Per scoprire come personalizzare un disco secondario, consulta Creare un disco secondario personalizzato.

Replica asincrona DP e dischi permanenti a livello di regione

Puoi utilizzare la replica asincrona PD con dischi permanenti a livello di regione per ottenere l'alta disponibilità e il ripristino di emergenza (RE).

I dischi permanenti a livello di regione possono essere utilizzati come disco primario o secondario in una coppia di dischi di replica asincrona PD. Una coppia di dischi è un disco primario che replica in un disco secondario.

Quando un disco regionale viene utilizzato come disco primario, la replica non viene interrotta se si verifica un'interruzione in una delle zone del disco primario. Il disco primario regionale continua a replicare dalla zona integro al disco secondario.

Quando un disco regionale viene utilizzato come disco secondario, la replica viene messa in pausa se si verifica un'interruzione in una delle zone del disco secondario. In questo caso, la replica non continua nella zona integro del disco secondario. Tuttavia, l'utilizzo di dischi regionali come dischi secondari può preparare il tuo carico di lavoro per l'alta disponibilità tra zone in caso di failover quando il disco secondario diventa il nuovo disco primario.

Limitazioni

  • La replica asincrona PD è supportata solo per disco permanente bilanciato e con prestazioni (SSD).
  • I dischi di sola lettura e i dischi multi-writer non sono supportati.
  • Ogni disco può avere una dimensione massima di 32 TiB.
  • Ogni progetto può avere al massimo 1000 coppie di dischi in ogni coppia di regioni.

    Ad esempio, un determinato progetto, project-1 può avere fino a 1000 coppie di dischi nella coppia di regioni Iowa-Oregon. project-1 può anche avere fino a 1000 coppie di dischi nella coppia di regioni Belgio e Francoforte.

Aree geografiche supportate

La replica asincrona PD è disponibile in tutte le regioni dei seguenti continenti:

  • Asia, ad eccezione dell'Indonesia
  • Europa
  • Nord America
  • Oceania

Puoi replicare un disco primario in una determinata regione in un disco secondario in qualsiasi regione disponibile all'interno dello stesso continente. Ciò significa che puoi creare una coppia di regioni da due regioni qualsiasi nello stesso continente.

Ad esempio, supponiamo che tu abbia un disco primario a Francoforte (europe-west3). Puoi replicare il disco su un disco secondario in qualsiasi punto dell'Europa, ma non puoi replicarlo in una regione del Nord America.

Per un elenco completo di tutte le regioni in Compute Engine, consulta Zone e regioni disponibili.

Prestazioni

Il Recovery Point Objective (RPO), o il ritardo temporale per la disponibilità dei dati nel sito secondario, dipende dalle velocità di modifica del disco. La replica asincrona PD replica in genere i dati con un RPO di destinazione di un minuto, per un massimo di 2 GB di blocchi modificati compressi al minuto, con blocchi di disco replicati con una granularità dei blocchi di 4 kB. Se un determinato blocco viene modificato più volte tra un evento di replica e l'altro, solo la modifica più recente viene replicata sul disco secondario. A velocità di modifica del disco più elevate, l'RPO può essere superiore a un minuto e in genere aumenta con l'aumento della velocità di modifica del disco. L'RPO non è configurabile.

L'RPO può superare un minuto nei seguenti scenari:

  • Quando viene avviata la replica del disco. Durante la replica iniziale, la replica asincrona PD replica tutti i blocchi utilizzati sul disco primario nel disco secondario. La replica iniziale è completa quando la metrica disk/async_replication/time_since_last_replication è disponibile in Cloud Monitoring.
  • Se la frequenza di modifica del disco è superiore a 2 GB di blocchi modificati compressi al minuto. Dopo un picco di modifiche del disco, l'RPO per i cicli di replica successivi potrebbe superare un minuto durante il recupero della replica.
  • Se scolleghi un disco da una VM o riavvii una VM mentre il disco è in replica. I dischi in fase di replica scollegati da una VM potrebbero registrare un aumento dell'RPO fino a cinque minuti per un breve periodo di tempo.

Per scoprire come visualizzare l'RPO per i tuoi dischi, consulta Metriche sulle prestazioni della replica asincrona del disco permanente.

Il Recovery Time Objective (RTO) durante il failover dipende dal tempo necessario per completare le varie attività associate al failover del carico di lavoro in una nuova regione. Il completamento di attività come l'arresto della replica e il collegamento dei dischi alle VM nella regione secondaria dovrebbero richiedere solo pochi minuti. Per velocizzare l'RTO, assicurati che le VM siano in esecuzione nella regione secondaria, in modo che, in caso di failover, non sia necessario attendere l'avvio delle VM.

Passaggi successivi