Disponibilidade e durabilidade dos dados

Esta página aborda conceitos relacionados com a disponibilidade e a durabilidade dos dados no Cloud Storage, incluindo a forma como o Cloud Storage armazena dados de forma redundante, o comportamento de replicação predefinido para regiões duplas e multirregiões, a funcionalidade de replicação turbo para regiões duplas e a funcionalidade de replicação entre contentores.

Conceitos-chave

  • O Cloud Storage foi concebido para uma durabilidade anual de 99,999999999% (11 noves).

    • Para tal, o Cloud Storage usa a codificação de apagamento e armazena pedaços de dados de forma redundante em vários dispositivos localizados em várias zonas de disponibilidade.

    • O Cloud Storage armazena objetos de forma redundante que são escritos no mesmo em, pelo menos, duas zonas de disponibilidade diferentes antes de considerar a escrita como bem-sucedida.

    • As somas de verificação são armazenadas e revalidadas regularmente para validar proativamente a integridade de todos os dados em repouso, bem como para detetar a corrupção de dados em trânsito. Se necessário, as correções são feitas automaticamente através de dados redundantes.

  • A disponibilidade mensal dos dados armazenados no Cloud Storage depende da classe de armazenamento dos dados e do tipo de localização do contentor. Para mais informações, consulte as classes de armazenamento disponíveis.

  • Os objetos armazenados num contentor de duas regiões ou várias regiões são armazenados de forma redundante em, pelo menos, dois locais geográficos separados.

    • Para regiões duplas, seleciona as regiões específicas nas quais os seus objetos são armazenados.

    • Para as multirregiões, os centros de dados específicos usados para armazenar os seus dados são determinados pelo Cloud Storage, conforme necessário, mas estão localizados dentro do limite geográfico da multirregião e estão separados por, pelo menos, 160 km. Isto oferece redundância entre regiões a um custo de armazenamento inferior ao das duas regiões.

    • No caso improvável de uma indisponibilidade ao nível da região, como uma causada por um desastre natural, os contentores em duas regiões e multirregionais permanecem disponíveis, sem necessidade de alterar os caminhos de armazenamento.

    Para mais informações sobre considerações específicas da região, consulte o artigo Geografia e regiões.

  • Normalmente, os objetos armazenados em contentores de duas regiões e multirregiões são replicados em locais geográficos através da replicação predefinida.

    • Se um dos locais onde um objeto está armazenado ficar indisponível depois de o objeto ser carregado com êxito, mas antes de ser replicado para o segundo local, a consistência forte do Cloud Storage garante que não são disponibilizadas versões desatualizadas do objeto e que as substituições subsequentes não são revertidas quando a região ficar novamente disponível.

    • Os objetos armazenados em duas regiões podem usar opcionalmente a replicação turbo para alcançar uma replicação mais rápida e previsível entre regiões.

  • Para alcançar a redundância entre um par de regiões não disponível como uma região dupla, considere criar um contentor separado em cada região e usar o Serviço de transferência de armazenamento transferências orientadas por eventos ou replicação entre contentores para manter os contentores sincronizados.

Redundância entre regiões

Embora os modelos de armazenamento tradicionais dependam frequentemente de uma abordagem ativa-passiva com localizações geográficas "primárias" e "secundárias", as regiões duplas e as multirregiões do Cloud Storage oferecem uma arquitetura ativa-ativa baseada num único contentor com redundância entre regiões. Isto simplifica o processo de recuperação de desastres, eliminando a necessidade de os utilizadores replicarem dados de um contentor para outro ou fazerem manualmente a comutação por falha para um contentor secundário em caso de indisponibilidade da região principal.

O Cloud Storage compreende sempre o estado atual de um contentor e disponibiliza de forma transparente objetos de uma região disponível, conforme necessário. Como resultado, os contentores de região dupla e multirregionais são concebidos para ter um tempo de recuperação objetivo (RTO) de zero, e as falhas regionais temporárias são normalmente invisíveis para os utilizadores. No caso de uma indisponibilidade regional, os contentores de região dupla e multirregionais continuam automaticamente a publicar todos os dados que foram replicados em várias regiões.

No entanto, a redundância entre regiões ocorre de forma assíncrona e quaisquer dados que não terminem a replicação entre regiões antes de uma região ficar indisponível ficam inacessíveis até a região em baixo voltar a ficar online. Os dados podem ser perdidos na eventualidade muito improvável de destruição física da região.

A replicação predefinida no Cloud Storage foi concebida para oferecer redundância em várias regiões para 99,9% dos objetos recém-escritos num objetivo de uma hora e 100% dos objetos recém-escritos num objetivo de 12 horas. Os objetos escritos recentemente incluem carregamentos, reescritas, cópias e composições.

O Cloud Storage também oferece uma capacidade de replicação entre contentores que pode ser usada para replicar dados entre contentores independentes de modo a satisfazer necessidades de replicação de dados adicionais que não são satisfeitas por localizações de região dupla ou multirregião.

Replicação turbo

A replicação turbo oferece uma redundância mais rápida entre regiões para os dados nos seus contentores de duas regiões, o que reduz o risco de exposição à perda de dados e ajuda a suportar um serviço ininterrupto após uma interrupção regional. Quando ativada, a replicação turbo é concebida para replicar 100% dos objetos recém-escritos para as duas regiões que constituem uma região dupla no objetivo do ponto de recuperação de 15 minutos, independentemente do tamanho do objeto.

Tenha em atenção que, mesmo para a replicação predefinida, a maioria dos objetos termina a replicação em poucos minutos.

Embora a redundância entre regiões e a replicação turbo ajudem a apoiar os esforços de continuidade do negócio e recuperação de desastres (BCDR), os administradores devem planear e implementar uma arquitetura de BCDR completa adequada à respetiva carga de trabalho.

Para mais informações, consulte o Guia passo a passo para conceber a recuperação de desastres para aplicações no Google Cloud.

Limitações

  • A replicação turbo só está disponível para contentores em regiões duplas.

  • Não é possível gerir a replicação turbo através da API XML, incluindo a criação de um novo contentor com a replicação turbo ativada.

  • Quando a replicação turbo está ativada num contentor, pode demorar até 10 segundos antes de começar a ser aplicada a objetos recém-escritos.

  • As gravações de objetos iniciadas antes de ativar a replicação turbo num contentor são replicadas entre regiões à taxa de replicação predefinida.

    • A composição de objetos que usa quaisquer objetos de origem escritos com a replicação predefinida nas últimas 12 horas cria um objeto composto que também usa a replicação predefinida.

Replicação entre contentores

Em alguns casos, pode querer manter uma cópia dos seus dados num segundo contentor. A replicação entre contentores copia objetos novos e atualizados de forma assíncrona de um contentor de origem para um contentor de destino.

A replicação entre contentores difere da replicação predefinida e da replicação turbo porque os seus dados existem em dois contentores independentes, cada um com as suas próprias configurações, como a localização de armazenamento, a encriptação, o acesso e a classe de armazenamento. É especialmente adequado para:

  • Soberania dos dados: mantenha os dados em regiões geograficamente distantes.
  • Manter versões de desenvolvimento e produção separadas: crie contentores e espaços de nomes distintos para que o desenvolvimento não afete a sua carga de trabalho de produção.
  • Partilha de dados: replique dados para um contentor pertencente a um fornecedor ou parceiro.
  • Agregação de dados: combine dados de diferentes contentores num único contentor para executar cargas de trabalho de estatísticas.
  • Gerir custos, segurança e conformidade: mantenha os seus dados sob diferentes proprietários, classes de armazenamento e períodos de retenção.

A replicação entre contentores usa o Serviço de transferência de armazenamento para replicar objetos e o Pub/Sub para receber alertas de alterações aos contentores de origem e de destino. Pode ativar a replicação entre contentores em novos contentores que criar e em contentores existentes.

Para contentores em que a taxa de alteração de objetos é inferior a 3000 por segundo e os objetos são inferiores a 1 GiB, a replicação entre contentores demora normalmente minutos a dezenas de minutos, mas não é suportado nenhum limite superior específico. Além disso, os contentores com taxas de alteração mais elevadas ou com objetos maiores podem esperar atrasos de replicação mais longos.

Para obter instruções sobre como usar a replicação entre contentores, consulte o artigo Use a replicação entre contentores.

Limitações

  • A replicação entre contentores não é suportada para contentores de espaço de nomes hierárquicos.

  • As eliminações de objetos no contentor de origem não são replicadas para o contentor de destino.

  • As configurações do ciclo de vida dos objetos não são replicadas.

  • Quando os objetos são replicados, os metadados de data/hora (por exemplo, timeCreated e timeUpdated) não são preservados. Consulte o artigo Transferências entre contentores do Cloud Storage para ver detalhes sobre a preservação de metadados.

  • Uma vez que a replicação entre contentores pode ser usada para replicar dados entre contentores localizados em qualquer localização, o desempenho da replicação entre contentores varia consoante as localizações selecionadas. Google Cloud Consequentemente, a replicação entre contentores não oferece um objetivo de ponto de recuperação (OPR).

Monitorização do desempenho

O Cloud Storage monitoriza os objetos não replicados mais antigos em contentores de duas regiões e multirregionais através da replicação predefinida ou da replicação turbo. Se um objeto permanecer não replicado durante mais tempo do que o tempo do RPO (objetivo de ponto de recuperação), é considerado fora do RPO. Cada minuto em que um ou mais objetos estão fora do RPO é contabilizado como um minuto "mau".

Por exemplo, se um objeto gerou 20 minutos inválidos das 09:00 às 09:20 e outro objeto gerou 10 minutos inválidos das 09:15 às 09:25, existem dois objetos para o mês que estão fora do RPO. O número total de minutos com problemas no mês é de 25 minutos, porque das 09:00 às 09:25 houve, pelo menos, um objeto ao qual faltava o RPO.

  • Para contentores que usam a replicação turbo, o RPO para objetos é de 15 minutos.

  • Para contentores que usam a replicação predefinida, o RPO para objetos é de 12 horas.

    • Para contentores que usam a replicação predefinida, os objetos são normalmente replicados em 1 hora ou menos.
  • A replicação entre contentores não fornece um RPO.

Na Google Cloud consola, o gráfico Percentagem de minutos fora do RPO permite-lhe monitorizar a percentagem de minutos inválidos durante os últimos 30 dias para o seu contentor quando usa a replicação predefinida ou a replicação turbo em contentores de região dupla ou multirregião. Este indicador do nível de serviço pode ser usado para monitorizar a conformidade do tempo de replicação mensal do seu contentor. Da mesma forma, a percentagem de objetos fora do alvo monitoriza as replicações de objetos que não ocorreram no OPR. Este indicador do nível de serviço pode ser usado para monitorizar a conformidade do volume de replicação mensal do contentor. Para mais informações, consulte os artigos Monitorização do Cloud Storage e SLA do Cloud Storage.

O que se segue?