Disponibilità e durabilità dei dati

Questa pagina illustra i concetti relativi alla disponibilità e alla durabilità dei dati in Cloud Storage, tra cui la modalità di archiviazione ridondante dei dati da parte di Cloud Storage, il comportamento di replica predefinito per le regioni a due e a più regioni, la funzionalità di replica turbo per le regioni a due e la funzionalità di replica tra bucket.

Concetti fondamentali

  • Cloud Storage è progettato per il 99,999999999% (11 9) nel tempo.

    • Per raggiungere questo obiettivo, Cloud Storage utilizza la codifica di cancellazione e archivia pezzi di dati in modo ridondante su più dispositivi situati in più zone di disponibilità.

    • Cloud Storage archivia in modo ridondante gli oggetti scritti in almeno due zone di disponibilità diverse prima di considerare la scrittura riuscita.

    • I checksum vengono memorizzati e riconvalidati regolarmente per verificare l'integrità di tutti i dati at-rest e rilevare il danneggiamento dei dati in trasporto pubblico. Se necessario, le correzioni vengono effettuate automaticamente e i dati di Google Cloud.

  • La disponibilità mensile dei dati archiviati in Cloud Storage dipende la classe di archiviazione dei dati e il tipo di località del bucket. Per maggiori informazioni per informazioni, consulta le classi di archiviazione disponibili.

  • Gli oggetti archiviati in un bucket a due regioni o in più regioni vengono archiviati in modo redundante in almeno due località geografiche separate.

    • Per le regioni doppie, seleziona le regioni specifiche in cui vengono archiviati gli oggetti.

    • Nel caso di più regioni, i data center specifici utilizzati per archiviare i dati sono determinati da Cloud Storage in base alle esigenze, ma si trovano all'interno il confine geografico di più regioni e sono separati da almeno 160 chilometri Questo fornisce ridondanza tra le regioni a un costo di archiviazione inferiore rispetto alle due regioni.

    • Nell'improbabile caso di interruzione a livello di regione, ad esempio causata da un disastri naturali, i bucket a due e più regioni rimangono disponibili, senza dover modificare i percorsi di archiviazione.

  • Gli oggetti archiviati in bucket a due regioni e multiregione vengono in genere riproduttivi in località geografiche utilizzando la replica predefinita.

    • Se una delle posizioni in cui è archiviato un oggetto diventa non disponibile dopo il dell'oggetto viene caricato correttamente, ma prima che venga replicato seconda località, l'elevata coerenza di Cloud Storage garantisce le versioni obsolete dell'oggetto non saranno pubblicate e quelle successive che le sovrascritture non vengono ripristinate quando la regione diventa di nuovo disponibile.

    • Per gli oggetti archiviati in due regioni è possibile utilizzare la replica turbo per ottenere una replica più rapida e prevedibile tra le regioni.

  • Per ottenere la ridondanza tra un accoppiamento di regioni non disponibile come doppia regione, valuta la possibilità di creare un bucket separato in ogni regione e di utilizzare i trasferimenti basati su eventi o la replica tra bucket di Storage Transfer Service per mantenere i bucket in sync.

Ridondanza tra regioni

Mentre i modelli di archiviazione tradizionali spesso si basano su un approccio attivo-passivo "principale" e "secondario" località geografiche, Cloud Storage offre un'architettura attiva-attiva basata su un singolo bucket con ridondanza regioni. In questo modo, il processo di ripristino di emergenza viene semplificato eliminando la necessità per gli utenti di replicare i dati da un bucket all'altro o di eseguire manualmente il failover a un bucket secondario in caso di interruzione del servizio nella regione principale.

Cloud Storage comprende sempre lo stato corrente di un bucket e, se necessario, serve in modo trasparente gli oggetti da una regione disponibile. Di conseguenza, i bucket a due e più regioni sono progettati per avere un Recovery Time Objective (RTO) pari a zero, mentre gli errori regionali temporanei normalmente invisibile agli utenti; in caso di interruzione regionale, due regioni i bucket multiregionali continuano a gestire automaticamente tutti i dati replicati tra regioni.

Tuttavia, la ridondanza tra le regioni avviene in modo asincrono e tutti i dati la cui replica tra le regioni non viene completata prima che una regione non sia più disponibile non sono accessibili fino a quando la regione non viene ripristinata. I dati potrebbero potenzialmente andranno persi nell'improbabile caso di distruzione fisica della regione.

La replica predefinita in Cloud Storage è progettata per fornire ridondanza tra le regioni per il 99,9% degli oggetti appena scritti entro un obiettivo di un'ora e per il 100% degli oggetti appena scritti entro un obiettivo di 12 ore. Gli oggetti scritti di recente includono caricamenti, riscritture, copie e composizioni.

Replica turbo

La replica Turbo fornisce una ridondanza più rapida tra le regioni per i dati nei bucket a due regioni, il che riduce il rischio di perdita di dati e aiuta a supportare un servizio ininterrotto in seguito a un'interruzione a livello di regione. Quando abilitata, la replica turbo è progettata per replicare il 100% dei alle due regioni che costituiscono una doppia regione all'interno Recovery Point Objective (Obiettivo punto di recupero) di 15 minuti, a prescindere dalle dimensioni dell'oggetto.

Tieni presente che anche per la replica predefinita, la maggior parte degli oggetti completa la replica in pochi minuti.

Sebbene la ridondanza tra regioni e la replica turbo contribuiscano a supportare le iniziative di continuità aziendale e ripristino di emergenza (BCDR), gli amministratori devono pianificare e implementare un'architettura BCDR completa adatta al loro carico di lavoro.

Per ulteriori informazioni, consulta la guida passo passo alla progettazione del piano di ripristino dei disastri per le applicazioni in Google Cloud.

Limitazioni

  • La replica turbo è disponibile solo per i bucket in due regioni.

  • La replica turbo non può essere gestita tramite l'API XML, inclusa la creazione di un nuovo bucket con la replica turbo abilitata.

  • Quando la replica turbo è abilitata su un bucket, può richiedere fino a 10 secondi prima che inizi ad applicarsi agli oggetti appena scritti.

  • Scritture degli oggetti avviate prima dell'abilitazione della replica turbo su un bucket di replicare tra regioni con la frequenza di replica predefinita.

    • La composizione di oggetti che utilizza gli oggetti di origine scritti utilizzando la replica predefinita nelle ultime 12 ore crea un oggetto composto che utilizza anche la replica predefinita.

Replica tra bucket

In alcuni casi, potrebbe essere utile conservare una copia dei dati in un secondo di sincronizzare la directory di una VM con un bucket. La replica tra bucket copia oggetti nuovi e aggiornati in modo asincrono da un bucket di origine a un bucket di destinazione.

La replica tra bucket è diversa dalla replica predefinita e dalla replica turbo in quanto i dati esistono in due bucket, ciascuno con le proprie configurazioni, come posizione di archiviazione, crittografia, accesso e classe di archiviazione. Di conseguenza, offre recupero e disponibilità dei dati, ma è adatto anche a:

  • Sovranità dei dati: mantieni i dati in regioni geograficamente distanti.
  • Mantieni versioni di sviluppo e produzione separate: crea versioni distinte bucket e spazi dei nomi, in modo che lo sviluppo non influisca sulla tua carico di lavoro.
  • Condividi i dati: replica i dati in un bucket di proprietà di un fornitore o partner.
  • Aggregazione dei dati: combina i dati di diversi bucket in un unico per eseguire carichi di lavoro di analisi.
  • Gestisci costi, sicurezza e conformità: mantieni i tuoi dati sotto proprietà, classi di archiviazione e periodi di conservazione diversi.

La replica tra bucket utilizza Storage Transfer Service per replicare gli oggetti e Pub/Sub per ricevere avvisi in caso di modifiche all'origine e alla destinazione bucket. La replica tra bucket può essere attivata nei nuovi bucket che crei e nei bucket esistenti. La maggior parte degli oggetti può essere replicata nell'ordine minuti, mentre gli oggetti di dimensioni superiori a un GiB possono richiedere diverse ore.

Per istruzioni sull'utilizzo della replica tra bucket, consulta Utilizzare la replica tra bucket.

Limitazioni

  • Le eliminazioni di oggetti nel bucket di origine non vengono replicate nel bucket di destinazione.

  • Le configurazioni del ciclo di vita degli oggetti non vengono replicate.

  • Quando gli oggetti vengono replicati, i metadati dei timestamp (ad esempio timeCreated e timeUpdated) non vengono conservati. Consulta: Trasferimenti tra bucket Cloud Storage per maggiori dettagli sulla conservazione dei metadati.

Monitoraggio delle prestazioni

Cloud Storage monitora gli oggetti non replicati meno recenti. Se un oggetto rimane non replicata per un periodo superiore a quello dell'RPO (Recovery Point Objective), è considerato fuori dall'RPO. Ogni minuto in cui uno o più oggetti vengono rispetto all'RPO viene conteggiato come "scarso" minuto.

Ad esempio, se un oggetto ha generato 20 minuti con problemi dalle 9:00 alle 9:20 e un altro oggetto ha generato 10 minuti con problemi dalle 9:15 alle 9:25, significa che per il mese esistono due oggetti fuori dall'RPO. Il numero totale di minuti non validi del mese è di 25 minuti perché dalle 9:00 alle 9:25 c'era almeno un oggetto a cui mancava l'RPO.

  • Per i bucket che utilizzano la replica turbo, l'RPO per gli oggetti è di 15 minuti.

  • Per i bucket che utilizzano la replica predefinita, l'RPO per gli oggetti è di 12 ore.

    • Per i bucket che utilizzano la replica predefinita, gli oggetti vengono generalmente replicati in un'ora o meno.
  • La replica tra bucket non fornisce un RPO.

Nella console Google Cloud, il grafico Percentuale di minuti rispetto all'RPO consente di monitorare la percentuale di minuti non validi negli ultimi 30 giorni per il bucket. Questo indicatore del livello di servizio può essere utilizzato per monitorare la conformità del tempo di replica mensile del bucket. Analogamente, la percentuale di oggetti fuori target monitora le repliche degli oggetti che non si sono verificate all'interno RPO (RPO). Questo indicatore del livello del servizio può essere utilizzato per monitorare la metrica mensile Conformità del volume di replica. Per ulteriori informazioni, consulta la pagina relativa al monitoraggio di Cloud Storage e allo SLA di Cloud Storage.

Passaggi successivi