Google Cloud para profissionais de data centers: armazenamento

Este artigo aborda os serviços de armazenamento no Google Cloud e como eles estão relacionados aos modelos de armazenamento tradicionais. O artigo descreve os seguintes tipos de armazenamento e os correspondentes em nuvem:

  • Armazenamento em disco, incluindo armazenamento conectado direto (DAS, na sigla em inglês), armazenamento conectado à rede (NAS, na sigla em inglês) e redes de área de armazenamento (SAN, na sigla em inglês)
  • Armazenamento de objetos
  • Armazenamento de arquivos, incluindo matrizes de disco e mídia de fita magnética

Principais componentes de armazenamento

Esta seção fornece uma breve pesquisa sobre os principais componentes de armazenamento fornecidos pelo Google Cloud.

Armazenamento em bloco

O Google Cloud oferece dois tipos de armazenamento em blocos. Os dois tipos de disco são integrados no Compute Engine, produto Infrastructure as a Service do Google Cloud (IaaS) e podem ser ativados em instâncias de máquina virtual do Compute Engine:

  • Discos permanentes, volumes conectados à rede que podem ser anexados às instâncias de VM
  • SSDs locais, conectados diretamente à máquina física em que a instância de VM está sendo executada

Discos permanentes

Os discos permanentes são volumes virtuais de armazenamento em bloco. Quando você cria uma instância de VM, ela vem com um único disco permanente inicializável que contém o sistema operacional da máquina. É possível anexar até 128 volumes ou 257 TB de discos permanentes, dependendo do tipo de máquina da VM.

O desempenho do disco permanente depende do tipo e do tamanho dele, bem como da capacidade máxima da instância de VM à qual ele é anexado. Cada disco permanente pode ter um HDD ou SSD, e cada tipo tem características de desempenho normalmente associadas ao correspondente físico dele: os discos permanentes HDD padrão são eficientes e econômicos para realizar operações de leitura/gravação sequenciais, enquanto os discos permanentes SSD são mais adequados para altas taxas de IOPS aleatórias. O desempenho de um determinado disco permanente aumentará com o tamanho do disco até você atingir os limites de capacidade da instância de VM anexada.

As máquinas com discos permanentes são co-localizadas na mesma zona que as máquinas com as instâncias de VM e são conectadas ao conjunto de redes do Google. Normalmente, as redes do Google podem proporcionar mais de um petabit por segundo de largura de banda de bisseção total, ajudando a garantir que os discos permanentes em rede tenham capacidade e propriedades de E/S comparáveis com os discos tradicionais anexados localmente.

Os discos permanentes disponíveis estão na zona em que residem, mas não são replicados entre as zonas. Se a instância de VM anexada a um disco permanente ficar off-line, esse disco permanente manterá os dados, mas ficará inacessível. Para garantir alta disponibilidade quando os discos permanentes são usados, é necessário que haja alta disponibilidade entre as regiões e as zonas em que a carga de trabalho está sendo executada. Para ver mais informações sobre regiões e zonas, consulte Regiões e zonas.

SSD local

Um SSD local é fisicamente anexado à mesma máquina host que a instância de VM do Compute Engine. Eles têm mais capacidade e menos latência do que os discos permanentes padrão ou discos permanentes SSD. Porém, eles têm algumas ressalvas:

  • Os SSDs locais são menos flexíveis que os discos permanentes. Ao contrário dos discos permanentes, eles têm restrição de tamanho de 375 GB. É possível anexar até oito volumes a determinada instância de VM de núcleo não compartilhado, e não é possível anexar SSDs locais a uma instância de VM de núcleo compartilhado. Também não é possível usar um SSD local como dispositivo de inicialização.
  • Os SSDs locais não são permanentes de modo geral. Embora os dados persistam, se você reiniciar a instância de VM, eles serão perdidos quando a instância for interrompida.

Armazenamento de objetos

Cloud Storage é um serviço de armazenamento de objetos hospedados que permite armazenar e acessar um grande número de objetos binários, ou blobs, de tamanhos variados. Os buckets do Cloud Storage são a opção de armazenamento mais escalonável e durável disponível no Google Cloud. Se os aplicativos não requerem armazenamento em blocos, considere seriamente armazenar os dados em um bucket do Cloud Storage.

O Cloud Storage oferece quatro classes principais de armazenamento. Todas as classes do Cloud Storage concedem acesso rápido a todos os dados e permitem o mesmo conjunto de chamadas de API:

  • O padrão oferece a maior disponibilidade das classes do Cloud Storage em um determinado local. Essa classe é ideal para armazenamento de conteúdo em grande escala e veiculação de arquivos de mídia. Quando usado na mesma região dos recursos de computação, ele é ideal para análise de dados, machine learning e cargas de trabalho de computação, como processamento de mídia.
  • Nearline, Coldline e Archive fornecem armazenamento econômico para os dados que você não pretende acessar com frequência, como dados de backup, recuperação de desastres e dados de arquivamento.

Comparações entre modelos de serviço

Esta seção mapeia os modelos de armazenamento de data center mais comuns para as ofertas de armazenamento do Google Cloud e discute como os serviços de nuvem se afastam das tecnologias tradicionais de data center.

Armazenamento anexado direto (DAS)

No data center, o armazenamento conectado direto (DAS, na sigla em inglês), às vezes chamado de disco local, é um volume físico diretamente anexado ao servidor físico. Esse volume pode ser anexado internamente, como um disco de inicialização, ou externamente, como no caso de um disco rígido externo. Para permitir que outros servidores acessem os dados em um disco local, você precisa autorizar explicitamente o sistema operacional do servidor para compartilhar o disco na rede.

Na nuvem, o disco local e o DAS não são necessariamente sinônimos. No Google Cloud, por exemplo, os SSDs locais e os discos permanentes podem suportar cargas de trabalho que esperam discos locais:

  • Os discos permanentes, embora conectados à rede nos bastidores, são o correspondente padrão do DAS no Compute Engine. Os dois tipos de disco permanente oferecem ótimo desempenho nos respectivos casos de uso, e ambos também são mais baratos do que os SSDs locais, o que faz deles uma boa opção para a maioria das cargas de trabalho.
  • Os SSDs locais são o correspondente mais direto do DAS tradicional, e uma ótima opção para cargas de trabalho com requisitos elevados de armazenamento e desempenho. No entanto, eles não são permanentes. Não é possível usá-los como discos de inicialização, e não convém usá-los para cargas de trabalho que esperam armazenamento local permanente.

Armazenamento em rede (NAS)

No data center, um dispositivo de armazenamento conectado à rede (NAS, na sigla em inglês), também chamado de arquivador, oferece um meio para os aplicativos fazerem a leitura e a atualização de arquivos que são compartilhados entre máquinas. Normalmente, o arquivador usa um protocolo que permite às máquinas clientes montarem um sistema de arquivos e os acessarem como se estivessem hospedados no local.

O Google Cloud fornece o Filestore, uma solução de arquivamento nativo como um serviço. Você também pode executar um arquivador no Google Cloud de várias maneiras. Para ver mais informações, consulte Servidores de arquivos no Compute Engine.

Rede de área de armazenamento (SAN)

No data center, a rede de área de armazenamento (SAN, na sigla em inglês) é uma unidade de armazenamento remota que proporciona acesso no nível do bloco e uma camada de gerenciamento interna pela qual é possível provisionar números de unidade lógica (LUNs, na sigla em inglês) individuais aos recursos. Ao conectar-se a uma SAN, os usuários a montam como um disco, em vez de se conectarem a um servidor com discos anexados, como acontece com o arquivador.

No Google Cloud, você pode usar discos permanentes para suportar cargas de trabalho que esperam SANs. Usados no contexto da SAN, os discos permanentes são correspondentes aos volumes de discos lógicos que você acessa por meio de dispositivos de número de unidade lógica (LUN, na sigla em inglês) e podem ser provisionados de modo similar. Assim como os volumes de discos lógicos baseados em LUN, é possível montar vários discos permanentes em uma única instância de VM. Além disso, também é possível ativar um mesmo disco permanente somente leitura em várias instâncias de VM.

Os discos permanentes são locais em uma zona específica, ou seja, é possível continuar usando o zoneamento LUN como estratégia para restringir o acesso da máquina, se necessário.

Ao migrar seu SAN para o Google Cloud, você também tem alguns benefícios exclusivos da nuvem:

  • A SAN baseada em disco permanente quase não tem limite de armazenamento. É possível provisionar novos discos permanentes em tempo real, sem se preocupar com a falta de espaço de armazenamento físico. As instâncias de VM individuais, no entanto, têm limite de 128 discos permanentes ou 64 TB de armazenamento em blocos.
  • Você não precisa se preocupar com as considerações de hardware físico, como a otimização do número de instâncias de VM que podem ser conectadas a uma determinada LUN.
  • Como os discos permanentes são replicados por padrão, você não precisa se preocupar em escolher o nível de RAID ideal.

Armazenamento de arquivamento

No data center, você usa tipos de mídia de armazenamento de arquivos padrão, como mídia de fita magnética, matriz de disco de armazenamento, ou ambas, para arquivar dados que precisam ser mantidos por muito tempo para fins comerciais ou jurídicos. Cada um desses tipos de armazenamento tem suas desvantagens:

  • As matrizes de disco de armazenamento podem ser caras. Além do custo inicial do próprio hardware, se a política de backup do usuário exigir que os dados sejam transferidos para fora do local, talvez seja necessário manter os backups em um segundo data center. Essa situação acarreta custos adicionais para estabelecer e manter a conectividade com esse data center.
  • A mídia de fita magnética é mais barata do que a matriz de disco de armazenamento, porém requer mais despesas administrativas. Para gerenciar seus arquivos de fitas com eficiência, você precisa de um servidor de catálogo que permita acompanhar o histórico de suas fitas, uma biblioteca de fitas e um administrador de sistemas para gerenciar a biblioteca, bem como as importações e as exportações associadas. Algumas empresas também requerem um fornecedor externo para realizar a coleta e a entrega seguras das fitas regularmente.

Quando você migra para a nuvem, esses gastos com recursos humanos e hardware são reduzidos. Por exemplo, no Google Cloud, você pode substituir os dois métodos por Cloud Storage Nearline, Cloud Storage Coldline e Cloud Storage Archive, que fornecem progressivamente soluções de armazenamento "mais frias". O Cloud Storage Nearline foi criado para os dados que você espera acessar menos de uma vez por mês. O Cloud Storage Coldline foi criado para os dados que você espera acessar menos de uma vez por trimestre. O Cloud Storage Archive foi criado para os dados que você espera acessar menos de uma vez por ano.

O Cloud Storage Nearline, o Cloud Storage Coldline e o Cloud Storage Archive ajudam a solucionar muitos dos problemas que afetam os métodos tradicionais de armazenamento em arquivos. Por exemplo, ao contrário das mídias de fita magnética, todas as três classes de armazenamento são duráveis e confiáveis. Você não precisa se preocupar com o estado de funcionamento da fita, com a recuperação dela de uma instalação externa ou com o problema de dados que ocupam várias fitas. Além disso, você não precisa mais se preocupar com a replicação de dados. Por padrão, cada classe de armazenamento do Cloud Storage replica seus dados para ajudar a garantir durabilidade e disponibilidade.

Além disso, o Cloud Storage Nearline, o Cloud Storage Coldline e o Cloud Storage Archive oferecem baixa latência que é comparável a uma matriz de disco de armazenamento no local, com subsegundos para recuperar seu primeiro byte de dados. Ao contrário da matriz de disco de armazenamento, porém, você não tem gastos iniciais com hardware e contratos de manutenção de alto custo. Com o Cloud Storage, você paga somente pelo que usa.

Por fim, o Cloud Storage integra-se a vários sistemas de gerenciamento de catálogo conhecidos. Com esse modelo, é possível continuar usando seu software atual e enviar seus novos backups de arquivos para o Cloud Storage Nearline, o Cloud Storage Coldline ou o Cloud Storage Archive. Para ver mais informações, consulte os parceiros do Cloud Storage.

Custos

Disco permanente e SSD local

Os discos permanentes e os SSDs locais do Compute Engine são cobrados mensalmente por GB. Para ver mais informações sobre preços de disco permanente e SSD local, consulte Preço do disco permanente.

Cloud Storage Standard

O modelo de definição de preço do Cloud Storage tem um contraste nítido com o do armazenamento tradicional do data center. Em um data center, você tem de comprar o hardware de armazenamento NAS ou SAN adiantado. Por outro lado, no Google Cloud Storage a cobrança é feita de acordo com o uso. Você será cobrado pela quantidade de dados armazenados por mês, pela quantidade de saídas da rede, pela quantidade de dados transferidos entre os locais e pelo número de solicitações de API feitas. Não se preocupe com contratos de manutenção ou custos associados a possíveis falhas decorrentes da compra do próprio hardware.

Para ver mais informações sobre preços, veja Preço do Cloud Storage.

Cloud Storage Nearline, Cloud Storage Coldline e Cloud Storage Archive

Assim como a classe de armazenamento do Cloud Storage Standard, o Cloud Storage Nearline, o Cloud Storage Coldline e o Cloud Storage Archive são cobrados pela quantidade de dados armazenados por mês, pela saída de rede e pela quantidade de dados transferidos entre locais. Como classes de arquivamento, os três também têm uma taxa de recuperação de armazenamento e um período de armazenamento mínimo. Se você excluir ou modificar os dados antes do período de armazenamento mínimo, receberá uma cobrança pelo restante do período. Por exemplo, ao excluir um objeto cinco dias após armazenar o objeto no Cloud Storage Nearline, os 25 dias restantes de armazenamento desse objeto serão cobrados.

Para mais informações sobre os preços do Cloud Storage Nearline, Cloud Storage Coldline e o Cloud Storage Archive, veja preços do Cloud Storage.

A seguir

Próximo: gerenciamento no Google Cloud