Escolher entre armazenamento SSD e HDD

Ao criar uma instância do Bigtable, você escolhe se os clusters dela armazenam dados em unidades de estado sólido (SSD) ou unidades de disco rígido (HDD):

  • O armazenamento SSD é a escolha mais eficiente e rentável para a maioria dos casos de uso.
  • Às vezes, o armazenamento HDD é apropriado para grandes conjuntos de dados que não são sensíveis à latência ou são acessados com pouca frequência.

Independentemente do tipo de armazenamento que você escolher, os dados serão armazenados em um sistema de arquivos distribuído e replicado que se estende por muitas unidades físicas.

As diretrizes desta página podem ajudar você a escolher entre SSD e HDD.

Na dúvida, escolha o armazenamento SSD

Há vários motivos pelo qual é melhor usar o armazenamento SSD para seu cluster do Bigtable:

  • O SSD é significativamente mais rápido e tem um desempenho mais previsível do que o HDD. Em um cluster do Bigtable, o armazenamento SSD oferece latências significativamente menores para leituras e gravações do que o armazenamento HDD.
  • A capacidade do HDD é muito mais limitada que a do SSD. Em um cluster que usa o armazenamento HDD, é possível atingir a capacidade máxima antes que o uso da CPU atinja 100%. É possível monitorar esta situação usando a métrica de carregamento de disco. Para aumentar a capacidade, é preciso adicionar mais nós, mas o custo de nós adicionais pode facilmente estourar seu orçamento ao usar o armazenamento HDD. O armazenamento SSD não tem essa limitação, porque oferece muito mais capacidade por nó. Geralmente, um cluster que usa armazenamento SSD atinge o máximo da capacidade somente quando está usando toda a CPU e memória disponíveis.
  • As leituras de linhas individuais no HDD são muito lentas. Devido ao tempo de busca do disco, o armazenamento do HDD é compatível apenas com 5% das linhas lidas por segundo de armazenamento SSD. No entanto, grandes verificações em várias linhas não são tão prejudicadas.
  • A economia de custos com HDD é mínima em relação ao custo dos nós no cluster do Bigtable, a menos que você esteja armazenando quantidades grandes de dados. Por isso, como regra geral, não use o armazenamento HDD, a menos que você armazene pelo menos 10 TB de dados, e a carga de trabalho não seja sensível à latência.

Uma possível desvantagem do armazenamento SSD é que ele exige mais nodes nos clusters com base nos dados armazenados. Porém, na prática, talvez você precise de nodes extras. Dessa maneira, os clusters podem acompanhar o tráfego de entrada e não servirão apenas para dar suporte ao volume de dados que está armazenando.

Casos de uso de armazenamento HDD

O armazenamento HDD é adequado para casos de uso que atendem a todos estes critérios:

  • Você espera armazenar pelo menos 10 TB de dados.
  • Você não usará os dados para auxiliar um aplicativo voltado para o usuário ou sensível à latência.
  • A carga de trabalho fica em uma das seguintes categorias:

    • Cargas de trabalho em lote com verificações e gravações, com leituras aleatórias de um pequeno número de leituras de linhas ou pontos.
    • Arquivamento de dados, em que você grava grandes volumes de dados e raramente os lê.

Por exemplo, caso você pretenda armazenar dados históricos extensos para um grande número de dispositivos de detecção remota e use os dados para gerar relatórios diários, a economia no armazenamento HDD pode justificar a implicação no desempenho. Por outro lado, se você planeja usar os dados para exibir um painel em tempo real, provavelmente não faria sentido usar o armazenamento HDD, porque as leituras seriam muito mais frequentes neste caso, e as leituras que não são verificações são muito mais lentas com armazenamento HDD.

Troca entre armazenamento SSD e HDD

Quando você cria uma instância do Bigtable, a escolha de armazenamento SSD ou HDD para a instância é permanente. Não é possível usar o console do Google Cloud para alterar o tipo de armazenamento usado para a instância.

Para alterar o tipo de armazenamento da tabela, use o recurso de backups:

  1. Crie ou planeje usar uma instância que use o tipo de armazenamento desejado.
  2. Crie um backup da tabela.
  3. Faça a restauração do backup para uma nova tabela na outra instância.

A seguir

Crie uma instância com armazenamento SSD ou HDD.