Disponibilidade e durabilidade dos dados

Nesta página, discutimos conceitos relacionados à disponibilidade e durabilidade dos dados no Cloud Storage, incluindo o modo do Cloud Storage de armazenar dados de forma redundante, o comportamento de replicação padrão para birregiões e multirregiões e o recurso de replicação turbo para birregiões.

Principais conceitos

  • O Cloud Storage foi projetado para oferecer durabilidade anual de 99,999999999% (11 noves).

    • Para isso, o Cloud Storage usa codificação de limpeza e armazena partes de dados de forma redundante em vários dispositivos localizados em várias zonas de disponibilidade.

    • O Cloud Storage armazena objetos de forma redundante, que são gravados nele em pelo menos duas zonas de disponibilidade diferentes antes de considerar a gravação bem-sucedida.

    • Os checksums são armazenados e revalidados regularmente para verificar de forma proativa a integridade de todos os dados em repouso, além de detectar a corrupção dos dados em trânsito. Se necessário, as correções são feitas automaticamente usando dados redundantes.

  • A disponibilidade mensal dos dados armazenados no Cloud Storage depende da classe de armazenamento dos dados e do tipo de local do bucket. Para mais informações, consulte as classes de armazenamento disponíveis.

  • Os objetos armazenados em um bucket birregional ou multirregional são armazenados de maneira redundante em pelo menos dois locais geográficos diferentes.

    • Para birregiões, você seleciona as regiões específicas em que seus objetos são armazenados.

    • Para multirregiões, os data centers específicos usados para armazenar os dados são determinados pelo Cloud Storage conforme necessário, mas estão localizados dentro do limite geográfico da multirregião e estão separados por pelo menos 160 quilômetros. Isso oferece redundância entre regiões por um custo de armazenamento menor do que as birregiões.

    • No caso improvável de uma falha temporária em toda a região, como aquela causada por um desastre natural, os buckets birregionais e multirregionais permanecerão disponíveis, sem a necessidade de alterar os caminhos de armazenamento.

  • Objetos armazenados em buckets birregionais e multirregionais geralmente são replicados em locais geográficos usando a replicação padrão.

    • Se um dos locais em que um objeto é armazenado ficar indisponível após seu upload, mas antes de o objeto ser replicado no segundo local, a consistência forte do Cloud Storage garantirá que as versões desatualizadas do objeto não serão disponibilizadas e que as substituições subsequentes não serão revertidas quando a região ficar disponível novamente.

    • Objetos armazenados em birregiões podem usar opcionalmente a replicação turbo para conseguir uma replicação mais rápida e previsível entre as regiões.

  • Para conseguir redundância entre um par de regiões não disponível como birregião, crie um bucket diferente em cada região e use as Transferências orientadas por eventos do Serviço de transferência do Cloud Storage para manter os buckets sincronizados.

Redundância entre regiões

Embora os modelos de armazenamento tradicionais geralmente dependam de uma abordagem ativa-passiva com localizações geográficas "primárias" e "secundárias", o Cloud Storage oferece uma arquitetura ativa-ativa com base em um único bucket com redundância entre regiões. Isso simplifica o processo de recuperação de desastres eliminando a necessidade de os usuários replicarem dados de um bucket para outro ou realizarem failover manualmente no bucket secundário em caso de inatividade da região primária.

O Cloud Storage sempre compreende o estado atual de um bucket e disponibiliza objetos de uma região disponível de forma transparente, conforme necessário. Como resultado, os buckets birregionais e multirregionais são projetados para ter um objetivo do tempo de recuperação (RTO) de zero, e as falhas regionais temporárias normalmente são invisíveis para os usuários. No caso de falha temporária regional, os buckets birregionais e multirregionais continuam disponibilizando automaticamente todos os dados replicados entre as regiões.

No entanto, a redundância nas regiões ocorre de forma assíncrona, e todos os dados que não terminam de replicar entre regiões antes que uma região fique indisponível ficam inacessíveis até que a região desativada fique on-line novamente. Os dados podem ser perdidos no caso muito improvável de destruição física da região.

A replicação padrão no Cloud Storage foi projetada para oferecer redundância entre regiões para 99,9% dos objetos recém-gravados no escopo de 1 hora e 100% dos objetos recém-gravados no escopo de 12 horas. Os objetos recém-gravados incluem uploads, regravações, cópias e composições.

Replicação turbo

A replicação turbo fornece redundância mais rápida entre regiões para dados nos seus buckets birregionais, o que reduz o risco de exposição à perda de dados e ajuda a oferecer suporte a serviços sem interrupções após uma falha temporária regional.

  • Quando ativada, a replicação turbo é projetada para replicar 100% dos objetos recém-gravados em ambas as regiões que formam a birregião dentro do objetivo do ponto de recuperação de 15 minutos, independentemente do tamanho do objeto.

Mesmo na replicação padrão, a maioria dos objetos termina a replicação em minutos.

Embora a redundância entre regiões e a replicação turbo ajudem a dar suporte a continuidade de negócios e esforços de recuperação de desastres (BCDR, na sigla em inglês), os administradores precisam planejar e implementar uma arquitetura BCDR completa que seja apropriada para a carga de trabalho deles.

Para mais informações, consulte o guia passo a passo para projetar a recuperação de desastres para aplicativos no Google Cloud.

Limitações

  • A replicação turbo está disponível apenas para buckets em regiões birregionais.

  • A replicação turbo não pode ser gerenciada pela API XML, incluindo a criação de um novo bucket com replicação turbo ativada.

  • Quando a replicação turbo está ativada em um bucket, ela pode levar até 10 segundos para começar a ser aplicada a objetos recém-gravados.

  • As gravações de objetos que começaram antes de ativar a replicação turbo em um bucket são replicadas entre as regiões com a taxa de replicação padrão.

    • A composição de objetos, que usa objetos de origem gravados com a replicação padrão nas últimas 12 horas, cria um objeto composto que também usa a replicação padrão.

Monitoramento de desempenho

O Cloud Storage monitora os objetos não replicados mais antigos em buckets que estão com a replicação turbo ativa. Se a recuperação de um objeto levar mais de 15 minutos, esses minutos extras ou "inválidos" serão exibidos no console do Google Cloud como Number of minutes missing RPO. Esse número representa um conjunto de minutos inválidos de todos os objetos no bucket.

Por exemplo, se um objeto produziu 20 minutos inválidos das 9h às 9h20 e outro objeto produziu 10 minutos inválidos das 9h15 às 9h25, o número total de minutos inválidos é 25 minutos, porque pelo menos um objeto perdeu o RPO das 9h às 9h25. Esse indicador de nível de serviço pode ser usado para monitorar a conformidade mensal de tempo de replicação do seu bucket.

O console do Google Cloud também rastreia o número de replicações de objetos concluídas, mostrado como Object replications with turbo. Esse indicador de nível de serviço pode ser usado para monitorar a conformidade do volume de replicação mensal do bucket. Para mais informações, consulte o SLA do Cloud Storage.

A seguir