Otimizar custo: armazenamento

Last reviewed 2023-08-08 UTC

Este documento no Framework da arquitetura do Google Cloud fornece recomendações para ajudar você a otimizar o uso e o custo dos seus recursos do Cloud Storage, Persistent Disk e Filestore.

As orientações nesta seção são destinadas a arquitetos e administradores responsáveis por provisionar e gerenciar o armazenamento de cargas de trabalho na nuvem.

Cloud Storage

Ao planejar o Cloud Storage para suas cargas de trabalho, considere seus requisitos de desempenho, retenção de dados e padrões de acesso.

Classe de armazenamento

Escolha uma classe de armazenamento que seja adequada aos requisitos de retenção de dados e frequência de acesso das cargas de trabalho, conforme recomendado na tabela a seguir:

Requisito de armazenamento Recomendação
Dados acessados com frequência (análises de alta capacidade ou data lakes, sites, streaming de vídeos e apps para dispositivos móveis). Standard storage
Armazenamento de baixo custo para dados acessados com pouca frequência que podem ser armazenados por pelo menos 30 dias (por exemplo, backups e conteúdo multimídia extenso). Nearline Storage
Dados acessados com pouca frequência que podem ser armazenados por pelo menos 90 dias (por exemplo, réplicas de dados para recuperação de desastres). Coldline Storage
Armazenamento de menor custo para dados acessados com pouca frequência que podem ser armazenados por pelo menos 365 dias (por exemplo, arquivos legais e regulamentares). Archive Storage

Local

Selecione o local dos seus buckets com base nos seus requisitos de desempenho, disponibilidade e redundância de dados.

  • As regiões são recomendadas quando a região está próxima dos seus usuários finais. É possível selecionar uma região específica e receber a redundância garantida na região. As regiões oferecem armazenamento rápido, redundante e acessível para os conjuntos de dados que os usuários de uma determinada área geográfica acessam com frequência.
  • As multirregiões oferecem alta disponibilidade para usuários distribuídos. No entanto, o custo de armazenamento é maior que o das regiões. Os buckets multirregionais são recomendados para casos de uso de veiculação de conteúdo e para cargas de trabalho de análise simples.
  • As regiões duplas oferecem alta disponibilidade e redundância de dados. O Google recomenda buckets birregionais para cargas de trabalho de análise de alto desempenho e para casos de uso que exigem buckets ativos-ativos reais com computação e armazenamento colocados em vários locais. Com o recurso de região dupla, você escolhe onde seus dados são armazenados, o que ajuda você a atender aos requisitos de conformidade. Por exemplo, é possível usar um bucket de região dupla para atender a requisitos específicos do setor relacionados à distância física entre cópias de seus dados na nuvem.

Políticas do ciclo de vida

Otimize o custo de armazenamento de objetos no Cloud Storage definindo políticas de ciclo de vida. Essas políticas ajudam a economizar dinheiro fazendo downgrade automaticamente da classe de armazenamento de objetos específicos ou excluindo objetos com base nas condições definidas.

Configure políticas de ciclo de vida com base na frequência com que os objetos são acessados e por quanto tempo você precisa retê-los. Veja a seguir exemplos de políticas de ciclo de vida:

  • Política de downgrade: você espera que um conjunto de dados seja acessado com frequência, mas apenas por cerca de três meses. Para otimizar o custo de armazenamento desse conjunto de dados, use o armazenamento padrão e configure uma política de ciclo de vida para fazer downgrade de objetos com mais de 90 dias para o armazenamento Coldline.
  • Política de exclusão: um conjunto de dados precisa ser retido por 365 dias para atender a determinados requisitos legais e pode ser excluído após esse período. Configure uma política para excluir qualquer objeto com mais de 365 dias.

    Para garantir que os dados que precisam ser retidos por um período específico (para conformidade legal ou regulatória) não sejam excluídos antes dessa data ou hora, configure bloqueios da política de retenção }

Responsabilidade

Para gerar responsabilidade por cobranças operacionais, cobranças de rede e custos de recuperação de dados, use a configuração Pagamentos do solicitante, quando apropriado. Com essa configuração, os custos são cobrados para o departamento ou a equipe que usa os dados, e não do proprietário.

Defina e atribua rótulos de rastreamento de custos de maneira consistente para todos os buckets e objetos. Automatize a rotulagem quando possível.

Redundância

Use as técnicas a seguir para manter a redundância de armazenamento necessária sem a duplicação de dados:

  • Para manter a resiliência de dados com uma única fonte de verdade, use um bucket birregional ou multirregional em vez de cópias redundantes de dados em buckets diferentes. Os buckets birregionais e multirregionais fornecem redundância entre regiões. Os dados são replicados de maneira assíncrona em dois ou mais locais e protegidos contra interrupções regionais.
  • Se você ativar o controle de versões de objetos, considere definir políticas de ciclo de vida para remover a versão mais antiga de um objeto conforme as versões mais recentes se tornam }não atual. Cada versão não atual de um objeto custa o mesmo que a versão ativa do objeto.
  • Desative as políticas de controle de versões de objetos quando elas não forem mais necessárias.
  • Revise as políticas de retenção de snapshots e backup periodicamente e ajuste-as para evitar backups desnecessários e retenção de dados.

Persistent Disk

Cada instância de VM implantada no Compute Engine tem um disco de inicialização e, opcionalmente, um ou mais discos de dados. Cada disco gera custos dependendo do tamanho provisionado, da região e do tipo de disco. Todos os snapshots capturados dos seus discos geram custos com base no tamanho deles.

Use as seguintes recomendações de projeto e operacionais para ajudar a otimizar o custo dos discos permanentes:

  • Não aloque muito espaço em disco. Não é possível reduzir a capacidade do disco após o provisionamento. Comece com um disco pequeno e aumente o tamanho quando necessário. Os discos permanentes são cobrados pela capacidade provisionada, e não pelos dados armazenados nos discos.
  • Escolha um tipo de disco que corresponda às características de desempenho da sua carga de trabalho. A SSD fornece altas IOPS e capacidade, mas custa mais do que os discos permanentes padrão.

  • Use discos permanentes regionais somente ao proteger dados contra interrupções zonais. Discos permanentes regionais são replicados para outra zona na região. Portanto, você gera o dobro de custos dos discos zonais equivalentes.

  • Acompanhe o uso dos discos permanentes usando o Cloud Monitoring e configure alertas para discos com pouco uso.

  • Exclua sites que não sejam mais necessários.

  • Para discos com dados que possam ser necessários no futuro, arquive os dados no Cloud Storage de baixo custo e exclua-os.

  • Procure e responda às recomendações no Hub de recomendações.

Considere também o uso de hiperdiscos para armazenamento de alto desempenho e discos temporários (SSDs locais) para armazenamento temporário.

Os snapshots de disco são incrementais por padrão e compactados automaticamente. Considere as seguintes recomendações para otimizar o custo dos snapshots de disco:

  • Quando possível, organize seus dados em discos permanentes separados. Você pode optar por fazer backup dos discos seletivamente e reduzir o custo de snapshots de discos.
  • Ao criar um snapshot, selecione um local com base nos requisitos de disponibilidade e nos custos de rede associados.
  • Se você pretende usar um snapshot de disco de inicialização para criar várias VMs, crie uma imagem do snapshot e use a imagem para criar suas VMs. Essa abordagem ajuda a evitar cobranças de rede por dados transmitidos entre o local do snapshot e o local onde ele é restaurado.
  • Configure uma política de retenção para minimizar os custos de armazenamento a longo prazo dos snapshots de disco.
  • Exclua os snapshots de disco que você não precisa mais. Cada snapshot em uma cadeia pode depender de dados armazenados em um snapshot anterior. Portanto, excluir um snapshot não necessariamente exclui todos os dados nele. Para excluir completamente os dados dos snapshots, exclua todos os snapshots da cadeia.

Filestore

O custo de uma instância do Filestore depende do nível de serviço, da capacidade provisionada e da região em que a instância é provisionada. Veja as recomendações de projeto e operacionais para otimizar o custo das instâncias do Filestore:

  • Selecione um nível de serviço e um tipo de armazenamento (HDD ou SSD) apropriados para suas necessidades de armazenamento.
  • Não aloque capacidade em excesso. Comece com um tamanho pequeno e aumente mais tarde, quando necessário. O faturamento do Filestore é baseado na capacidade provisionada, e não nos dados armazenados.
  • Sempre que possível, organize seus dados em instâncias separadas do Filestore. Você pode optar por fazer backup das instâncias seletivamente e reduzir o custo de backups do Filestore.
  • Ao escolher a região e a zona, crie instâncias na mesma zona dos clientes. A cobrança será feita pelo tráfego de transferência de dados da zona da instância do Filestore.
  • Ao decidir a região onde os backups do Filestore serão armazenados, considere as cobranças de transferência de dados para armazenar backups em uma região diferente da instância de origem.
  • Acompanhe o uso das instâncias do Filestore usando o Cloud Monitoring e configure alertas para instâncias com pouco uso.
  • Reduza a capacidade alocada para instâncias do Filestore que têm baixo uso. É possível reduzir a capacidade das instâncias, exceto o nível Básico.

A seguir