Disponibilità e durabilità dei dati

Questa pagina illustra i concetti relativi alla disponibilità e alla durabilità dei dati in Cloud Storage, tra cui la modalità di archiviazione ridondante dei dati da parte di Cloud Storage, il comportamento di replica predefinito per le regioni a due e a più regioni, la funzionalità di replica turbo per le regioni a due e la funzionalità di replica tra bucket.

Concetti fondamentali

  • Cloud Storage è progettato per garantire una durabilità annuale del 99,999999999% (11 nove).

    • Per raggiungere questo obiettivo, Cloud Storage utilizza la codifica di erasure e archivia con ridondanza i frammenti di dati su più dispositivi situati in più zone di disponibilità.

    • Cloud Storage archivia in modo ridondante gli oggetti scritti in almeno due zone di disponibilità diverse prima di considerare la scrittura riuscita.

    • I checksum vengono memorizzati e riconvalidati regolarmente per verificare in modo proattivo l'integrità di tutti i dati a riposo e per rilevare la corruzione dei dati in transito. Se necessario, le correzioni vengono apportate automaticamente utilizzando dati ridondanti.

  • La disponibilità mensile dei dati archiviati in Cloud Storage dipende dalla classe di archiviazione dei dati e dal tipo di località del bucket. Per ulteriori informazioni, consulta le classi di archiviazione disponibili.

  • Gli oggetti archiviati in un bucket a due regioni o in più regioni vengono archiviati in modo redundante in almeno due località geografiche separate.

    • Per le regioni doppie, seleziona le regioni specifiche in cui vengono archiviati gli oggetti.

    • Per le regioni multiple, i data center specifici utilizzati per l'archiviazione dei dati vengono determinati da Cloud Storage in base alle esigenze, ma si trovano all'interno del confine geografico della regione multipla e sono separati da almeno 160 km. Ciò fornisce ridondanza tra le regioni a un costo di archiviazione inferiore rispetto alle regioni doppie.

    • Nell'improbabile caso di un'interruzione a livello di regione, ad esempio quella causata da una calamità naturale, i bucket con due regioni e con più regioni rimangono disponibili senza dover modificare i percorsi di archiviazione.

  • Gli oggetti archiviati in bucket a due regioni e multiregione vengono in genere riproduttivi in località geografiche utilizzando la replica predefinita.

    • Se uno dei luoghi in cui è archiviato un oggetto diventa non disponibile dopo il caricamento dell'oggetto, ma prima che venga replicato nella seconda posizione, la coerenza forte di Cloud Storage garantisce che le versioni obsolete dell'oggetto non vengano pubblicate e che le sovrascritture successive non vengano annullate quando la regione diventa di nuovo disponibile.

    • Gli oggetti archiviati in due regioni possono, facoltativamente, utilizzare la replica turbo per ottenere una replica più rapida e prevedibile tra le regioni.

  • Per ottenere la ridondanza tra un accoppiamento di regioni non disponibile come doppia regione, prendi in considerazione la creazione di un bucket separato in ogni regione e l'utilizzo di Storage Transfer Service Trasferimenti basati su eventi o Replica tra bucket per mantenere i bucket in sync.

Ridondanza tra regioni

Sebbene i modelli di archiviazione tradizionali si basino spesso su un approccio attivo-passivo con località geografiche "principali" e "secondarie", Cloud Storage fornisce un'architettura attiva-attiva basata su un singolo bucket con ridondanza tra regioni. In questo modo, il processo di disaster recovery viene semplificato eliminando la necessità per gli utenti di replicare i dati da un bucket all'altro o di eseguire manualmente il failover a un bucket secondario in caso di interruzione del servizio nella regione principale.

Cloud Storage comprende sempre lo stato corrente di un bucket e, se necessario, serve in modo trasparente gli oggetti da una regione disponibile. Di conseguenza, i bucket a due regioni e multiregionali sono progettati per avere un obiettivo di tempo di recupero (RTO) pari a zero e i guasti regionali temporanei sono normalmente invisibili agli utenti. In caso di interruzione del servizio a livello di regione, i bucket a due regioni e multiregionali continuano automaticamente a pubblicare tutti i dati che sono stati replicati tra le regioni.

Tuttavia, la ridondanza tra le regioni avviene in modo asincrono e tutti i dati la cui replica tra le regioni non viene completata prima che una regione non sia più disponibile non sono accessibili fino a quando la regione non viene ripristinata. I dati potrebbero potenzialmente essere persi nel caso molto improbabile di distruzione fisica della regione.

La replica predefinita in Cloud Storage è progettata per fornire ridondanza tra le regioni per il 99,9% degli oggetti appena scritti entro un obiettivo di un'ora e per il 100% degli oggetti appena scritti entro un obiettivo di 12 ore. Gli oggetti scritti di recente includono caricamenti, riscritture, copie e composizioni.

Replica turbo

La replica Turbo fornisce una ridondanza più rapida tra le regioni per i dati nei bucket a due regioni, il che riduce il rischio di perdita di dati e aiuta a supportare un servizio ininterrotto in seguito a un'interruzione a livello di regione. Se attivata, la replica turbo è progettata per replicare il 100% degli oggetti appena scritti nelle due regioni che costituiscono una regione doppia entro il Recovery Point Objective (RPO) di 15 minuti, indipendentemente dalle dimensioni degli oggetti.

Tieni presente che anche per la replica predefinita, la maggior parte degli oggetti completa la replica in pochi minuti.

Sebbene la ridondanza tra regioni e la replica turbo contribuiscano a supportare le iniziative di continuità aziendale e ripristino di emergenza (BCDR), gli amministratori devono pianificare e implementare un'architettura BCDR completa adatta al loro carico di lavoro.

Per ulteriori informazioni, consulta la guida passo passo alla progettazione del ripristino di emergenza per le applicazioni in Google Cloud.

Limitazioni

  • La replica turbo è disponibile solo per i bucket in due regioni.

  • La replica turbo non può essere gestita tramite l'API XML, inclusa la creazione di un nuovo bucket con la replica turbo abilitata.

  • Quando la replica turbo è abilitata in un bucket, possono trascorrere fino a 10 secondi prima che inizi a essere applicata agli oggetti appena scritti.

  • Le scritture di oggetti iniziate prima dell'attivazione della replica turbo su un bucket vengono replicate tra le regioni alla frequenza di replica predefinita.

    • La composizione di oggetti che utilizza gli oggetti di origine scritti utilizzando la replica predefinita nelle ultime 12 ore crea un oggetto composto che utilizza anche la replica predefinita.

Replica tra bucket

In alcuni casi, potresti voler mantenere una copia dei dati in un secondo bucket. La replica tra bucket copia oggetti nuovi e aggiornati in modo asincrono da un bucket di origine a un bucket di destinazione.

La replica tra bucket è diversa dalla replica predefinita e dalla replica turbo in quanto i dati esistono in due bucket, ciascuno con le proprie configurazioni, come posizione di archiviazione, crittografia, accesso e classe di archiviazione. Di conseguenza, offre recupero e disponibilità dei dati, ma è adatto anche per:

  • Sovranità dei dati: mantieni i dati in regioni geograficamente distanti.
  • Mantieni versioni di sviluppo e di produzione separate: crea bucket e spazi dei nomi distinti in modo che lo sviluppo non influisca sul carico di lavoro di produzione.
  • Condividi i dati: replica i dati in un bucket di proprietà di un fornitore o partner.
  • Aggregazione dei dati: combina i dati di diversi bucket in un unico bucket per eseguire i carichi di lavoro di analisi.
  • Gestisci costi, sicurezza e conformità: gestisci i tuoi dati in base a proprietà, classi di archiviazione e periodi di conservazione diversi.

La replica tra bucket utilizza Storage Transfer Service per replicare gli oggetti e Pub/Sub per ricevere avvisi sulle modifiche ai bucket di origine e di destinazione. La replica tra bucket può essere attivata nei nuovi bucket che crei e nei bucket esistenti. La maggior parte degli oggetti può essere replicata nell'ordine di alcuni minuti, mentre gli oggetti di dimensioni superiori a 1 GB possono richiedere diverse ore.

Per istruzioni sull'utilizzo della replica tra bucket, consulta Utilizzare la replica tra bucket.

Limitazioni

  • Le eliminazioni di oggetti nel bucket di origine non vengono replicate nel bucket di destinazione.

  • Le configurazioni del ciclo di vita degli oggetti non vengono replicate.

  • Quando gli oggetti vengono replicati, i metadati dei timestamp (ad esempio timeCreated e timeUpdated) non vengono conservati. Per maggiori dettagli sulla conservazione dei metadati, consulta Trasferimenti tra bucket Cloud Storage.

Monitoraggio delle prestazioni

Cloud Storage monitora gli oggetti non replicati meno recenti. Se un oggetto rimane non replicato per più tempo del suo RPO (Recovery Point Objective), è considerato fuori dall'RPO. Ogni minuto in cui uno o più oggetti sono fuori dall'RPO viene conteggiato come un minuto "non valido".

Ad esempio, se un oggetto ha generato 20 minuti con problemi dalle 9:00 alle 9:20 e un altro oggetto ha generato 10 minuti con problemi dalle 9:15 alle 9:25, significa che per il mese esistono due oggetti fuori dall'RPO. Il numero totale di minuti non validi per il mese è di 25 minuti, perché dalle 9:00 alle 9:25 c'era almeno un oggetto per cui mancava l'RPO.

  • Per i bucket che utilizzano la replica turbo, il RPO per gli oggetti è di 15 minuti.

  • Per i bucket che utilizzano la replica predefinita, l'RPO per gli oggetti è di 12 ore.

    • Per i bucket che utilizzano la replica predefinita, gli oggetti vengono in genere replicati in un'ora o meno.
  • La replica tra bucket non fornisce un RPO.

Nella console Google Cloud, il grafico Percentuale di minuti rispetto all'RPO consente di monitorare la percentuale di minuti non validi negli ultimi 30 giorni per il bucket. Questo indicatore del livello di servizio può essere utilizzato per monitorare la conformità del tempo di replica mensile del bucket. Analogamente, la Percentuale di oggetti fuori dal target monitora le repliche di oggetti che non si sono verificate all'interno del RPO. Questo indicatore del livello di servizio può essere utilizzato per monitorare la conformità del volume di replica mensile del bucket. Per ulteriori informazioni, consulta la pagina relativa al monitoraggio di Cloud Storage e allo SLA di Cloud Storage.

Passaggi successivi