Informazioni su Persistent Disk a livello di regione

Un disco permanente regionale è un'opzione di archiviazione che consente di implementare servizi ad alta disponibilità in Compute Engine. Il disco permanente a livello di regione replica in modo sincrono i dati tra due zone nella stessa regione e garantisce l'alta disponibilità per i dati del disco per un massimo di un errore a livello di zona.

I volumi dei dischi permanenti a livello di regione sono progettati per i carichi di lavoro che richiedono un RPO (Recovery Point Objective) e un RTO (Recovery Time Objective) inferiori. Per scoprire di più su RPO e RTO, consulta Nozioni di base sulla pianificazione del ripristino di emergenza.

I volumi di dischi permanenti a livello di regione sono progettati per funzionare anche con i gruppi di istanze gestite a livello di regione.

Questo documento fornisce una panoramica sui Persistent Disk a livello di regione e su come utilizzare un volume di Persistent Disk a livello di regione per creare servizi ad alta disponibilità.

Quando decidi di utilizzare Persistent Disk a livello di regione, assicurati di confrontare le diverse opzioni per aumentare la disponibilità dei servizi e costi, prestazioni e resilienza per le diverse architetture di servizio.

Replica del disco di zona per Persistent Disk a livello di regione

Un volume di Persistent Disk a livello di regione ha una zona primaria e una secondaria all'interno della propria regione in cui archivia i dati del disco:

  • La zona principale corrisponde alla zona dell'istanza della macchina virtuale (VM) a cui colleghi il disco.
  • La zona secondaria è una zona alternativa a tua scelta all'interno della stessa regione.

Compute Engine gestisce le repliche del tuo volume di Persistent Disk a livello di regione in entrambe queste zone. Quando scrivi dati sul disco, Compute Engine li replica in modo sincrono alle repliche del disco in entrambe le zone per garantire l'alta disponibilità. I dati di ogni replica a livello di zona sono distribuiti su più macchine fisiche all'interno della zona per garantire la durabilità. Le repliche di zona assicurano che i dati del volume del Persistent Disk rimangano disponibili e forniscano protezione contro interruzioni temporanee in una delle zone del disco.

Stato di replica per le repliche a livello di zona

Lo stato di replica del disco per il Persistent Disk a livello di regione mostra lo stato di una replica a livello di zona rispetto al contenuto del disco. Le repliche di zona per il Persistent Disk a livello di regione si trovano sempre in uno dei seguenti stati di replica del disco:

  • Sincronizzata: la replica è disponibile, riceve in modo sincrono tutte le scritture eseguite sul disco ed è aggiornata con tutti i dati sul disco.
  • Recupero: la replica è disponibile, ma sta ancora recuperando i dati sul disco dall'altra replica.
  • Fuori sincronizzazione: la replica è temporaneamente non disponibile e non sincronizzata con i dati sul disco.

Per informazioni su come controllare e tracciare gli stati di replica delle repliche a livello di zona, consulta Monitorare gli stati di replica del disco dei volumi di Persistent Disk a livello di regione.

Stato di replica del disco permanente a livello di regione

A seconda dello stato delle singole repliche a livello di zona, il volume del Persistent Disk a livello di regione può trovarsi in uno dei seguenti stati di replica:

  • Completamente replicato. Le repliche in entrambe le zone sono disponibili e sincronizzate con i dati del disco più recenti.
  • Resta al passo. Le repliche a livello di zona sono disponibili, ma una delle repliche di zona sta recuperando i dati del disco più recenti.
  • Prestazioni ridotte: una delle repliche a livello di zona non è sincronizzata a causa di un errore o di un'interruzione.

Se il volume del Persistent Disk a livello di regione intercetta o è ridotto, una delle repliche a livello di zona non viene aggiornata con tutti i dati. Qualsiasi interruzione durante questo periodo nella zona della replica in stato integro comporta l'indisponibilità del volume del Persistent Disk a livello di regione fino al ripristino della zona di replica integro.

Quando il volume del Persistent Disk a livello di regione sta raggiungendo il limite, Google Cloud avvia la riparazione della replica di zona che sta recuperando. Google consiglia di attendere che la replica a livello di zona interessata registri i dati sul disco. Dopo che la replica a livello di zona passa allo stato sincronizzato, il volume del Persistent Disk a livello di regione torna di conseguenza a uno stato completamente replicato. Se il volume del Persistent Disk regionale sta recuperando o ridotto per un periodo di tempo prolungato e non soddisfa i requisiti dell'RPO dell'organizzazione, ti consigliamo di creare snapshot del disco in uno dei seguenti modi:

  • Abilita gli snapshot pianificati.
  • Crea uno snapshot manuale per il volume di Persistent Disk a livello di regione.

Dopo aver creato lo snapshot, puoi creare un nuovo volume di Persistent Disk a livello di regione utilizzando lo snapshot. Puoi recuperare i dati nel nuovo volume Persistent Disk a livello di regione. Il nuovo volume viene avviato in uno stato completamente replicato con una replica dei dati integro.

Per informazioni su come controllare lo stato di replica del tuo volume di Persistent Disk a livello di regione, consulta Determinare lo stato di replica del disco permanente a livello di regione.

Checkpoint di recupero della replica del disco permanente a livello di regione

Un checkpoint di recupero della replica è un attributo di Persistent Disk a livello di regione che rappresenta il punto coerente con gli arresti anomali più recente nel tempo di un disco completamente replicato. Compute Engine crea e gestisce automaticamente un singolo checkpoint di recupero della replica per ogni volume di Persistent Disk a livello di regione. Quando un volume di un Persistent Disk a livello di regione è completamente replicato, Compute Engine continua ad aggiornare il checkpoint ogni 10 minuti circa per garantire che il checkpoint rimanga aggiornato. Quando le prestazioni del volume Persistent Disk a livello di regione si riducono, Compute Engine consente di creare uno snapshot standard dal checkpoint di ripristino della replica di quel disco. Lo snapshot standard risultante acquisisce i dati della versione più recente coerente con gli arresti anomali del disco completamente replicato.

In rari casi, quando le prestazioni del disco sono ridotte, anche la replica a livello di zona sincronizzata con i dati più recenti del disco può non riuscire prima che la replica fuori sincronizzazione venga ripristinata. Non potrai collegare forzatamente il disco alle VM in nessuna delle due zone. Il volume del Persistent Disk a livello di regione non è più disponibile e devi eseguire la migrazione dei dati su un nuovo disco. In questi scenari, se non disponi di snapshot standard esistenti per il disco, potresti comunque riuscire a recuperare i dati del disco dalla replica incompleta utilizzando uno snapshot standard creato dal checkpoint di recupero della replica.

Compute Engine crea automaticamente punti di controllo di recupero della replica per ogni volume di Persistent Disk regionale montato. Non vengono addebitati costi aggiuntivi per la creazione di questi checkpoint. Tuttavia, ti vengono addebitati eventuali costi di archiviazione applicabili per la creazione di snapshot e VM quando utilizzi questi checkpoint per la migrazione del disco in zone funzionanti.

Scopri di più su come recuperare i dati del Persistent Disk a livello di regione utilizzando un checkpoint di recupero della replica.

Failover del disco permanente a livello di regione

In caso di interruzione di una zona, quest'ultima diventa inaccessibile e la VM al suo interno non può eseguire operazioni di lettura o scrittura sul suo disco. Per consentire alla VM di continuare a eseguire operazioni di lettura e scrittura sul disco, Compute Engine consente la migrazione dei dati del disco nell'altra zona in cui il disco ha una replica. Questo processo è chiamato failover Persistent Disk a livello di regione. Il processo di failover comporta lo scollegamento della VM dalla replica del disco nella zona interessata e il ricollegamento di una nuova VM alla replica del disco nell'altra zona. Compute Engine replica in modo sincrono i dati sul tuo disco nella regione secondaria per garantire un rapido failover in caso di errore di una singola replica.

Failover per piano di controllo regionale specifico per l'applicazione

Il piano di controllo regionale specifico per l'applicazione non è un servizio Google Cloud. Quando progetti architetture di servizio ad alta disponibilità, devi creare il tuo piano di controllo regionale specifico per l'applicazione. Questo piano di controllo dell'applicazione decide a quale VM deve essere collegato ilPersistent Diske a livello di regione e quale VM deve essere l'attuale VM principale. Quando viene rilevato un errore nella VM principale o nel database del volume del Persistent Disk a livello di regione, il piano di controllo regionale specifico per l'applicazione dell'architettura di servizio ad alta disponibilità può avviare automaticamente il failover alla VM in standby nella zona secondaria. Durante il failover, il piano di controllo a livello di regione specifico dell'applicazione ricollega il volume del Persistent Disk a livello di regione alla VM in standby nella zona secondaria. Compute Engine indirizza quindi tutto il traffico a quella VM in base agli indicatori del controllo di integrità.

La latenza complessiva di failover, escluso il tempo di rilevamento di errori, è la somma delle seguenti latenze:

  • Zero secondi per ricollegare un volume di Persistent Disk a livello di regione a una VM in standby
  • Tempo necessario per l'inizializzazione dell'applicazione e il ripristino degli arresti anomali

Per maggiori informazioni, consulta Informazioni sul piano di controllo a livello di regione specifico per l'applicazione

La pagina Componenti di base per il ripristino di emergenza illustra i componenti di base disponibili su Compute Engine.

Esegui il failover tramite associazione forzata

Uno dei vantaggi del Persistent Disk di regione è che, nell'improbabile caso di un'interruzione a livello di zona, puoi anche eseguire manualmente il failover del carico di lavoro in esecuzione su un Persistent Disk a livello di regione in un'altra zona. In caso di interruzione della zona originale, non puoi completare l'operazione di scollegamento finché non viene ripristinata la replica a livello di zona. In questo scenario, potresti dover collegare la nuova VM alla replica a livello di zona secondaria senza scollegarla dalla replica di zona principale. Questo processo è chiamato force-attach.

Quando l'istanza VM nella zona principale non è più disponibile, puoi forzare il collegamento del disco a un'istanza VM nella zona secondaria. Per eseguire questa attività, devi eseguire una delle seguenti operazioni:

  • Avvia un'altra istanza VM nella stessa zona del volume Persistent Disk a livello di regione di cui stai forzando il collegamento.
  • Mantieni un'istanza VM in standby a caldo in quella zona. Un hot standby è un'istanza VM in esecuzione identica a quella in uso. Le due istanze hanno gli stessi dati.

Compute Engine esegue l'operazione di associazione forzata in meno di un minuto. L'RTO (Recovery Time Objective) totale dipende non solo dal failover dell'archiviazione (il collegamento forzato del volume Persistent Disk a livello di regione), ma anche da altri fattori, tra cui:

  • Se devi prima creare un'istanza VM secondaria
  • Il periodo di tempo in cui il file system sottostante rileva un disco collegato a caldo
  • Il tempo di ripristino delle applicazioni corrispondenti

Per ulteriori informazioni su come eseguire il failover della VM utilizzando l'associazione forzata, consulta Eseguire il failover del volume Persistent Disk a livello di regione utilizzando force-attach.

Il disco permanente a livello di regione favorisce la disponibilità dei carichi di lavoro, il che significa che esistono compromessi per la protezione dei dati nell'improbabile eventualità che entrambe le repliche del disco non siano disponibili contemporaneamente. Per maggiori informazioni, consulta Gestire gli errori per il disco permanente a livello di regione.

Limitazioni

Le sezioni seguenti elencano le limitazioni che si applicano a Persistent Disk a livello di regione.

Limitazioni generali per Persistent Disk a livello di regione

  • Puoi collegare un Persistent Disk a livello di regione solo alle VM che utilizzano i tipi di macchine E2, N1, N2 e N2D.
  • Non puoi creare un Persistent Disk a livello di regione da un'immagine.
  • Se utilizzi la modalità di sola lettura, puoi collegare un Persistent Disk bilanciato a livello di regione a un massimo di 10 istanze VM.
  • La dimensione minima di un Persistent Disk standard a livello di regione è 200 GiB.
  • Puoi aumentare solo le dimensioni di un volume di Persistent Disk a livello di regione; non puoi ridurle.
  • I volumi di dischi permanenti a livello di regione hanno caratteristiche di prestazioni diverse rispetto ai volumi di Persistent Disk a livello di zona. Per maggiori informazioni, consulta Prestazioni dell'archiviazione a blocchi.
  • Se crei un Persistent Disk a livello di regione clonando un disco di zona, le due repliche a livello di zona non sono completamente sincronizzate al momento della creazione. Dopo la creazione, puoi utilizzare il clone del disco a livello di regione entro 3 minuti, in media. Tuttavia, potresti dover attendere decine di minuti prima che il disco raggiunga uno stato completamente replicato e che il Recovery Point Objective (RPO) sia vicino a zero. Scopri come controllare se il tuo Persistent Disk a livello di regione è completamente replicato.

Limitazioni per il checkpoint di recupero della replica di Persistent Disk a livello di regione

  • Un checkpoint di recupero della replica fa parte dei metadati del dispositivo e non mostra dati del disco da solo. Puoi utilizzare il checkpoint solo come meccanismo per creare uno snapshot del disco danneggiato. Dopo aver creato lo snapshot mediante il checkpoint, puoi utilizzarlo per ripristinare i dati.
  • Puoi creare snapshot da un checkpoint di recupero della replica solo quando le prestazioni del disco sono ridotte.
  • Compute Engine aggiorna il checkpoint di recupero della replica del disco solo quando il disco è completamente replicato.
  • Compute Engine gestisce un solo checkpoint di recupero della replica per un disco e solo la versione più recente di quel checkpoint.
  • Non puoi visualizzare i timestamp esatti di creazione e aggiornamento di un checkpoint di recupero della replica.
  • Puoi creare uno snapshot dal checkpoint di recupero della replica solo utilizzando l'API Compute Engine.

Passaggi successivi