Como escolher entre armazenamento SSD e HDD

Ao criar uma instância do Cloud Bigtable, você escolhe se os clusters dela armazenam dados em unidades de estado sólido (SSD, na sigla em inglês) ou unidades de disco rígido (HDD, na sigla em inglês):

  • O armazenamento SSD é a escolha mais eficiente e rentável para a maioria dos casos de uso.
  • Às vezes, o armazenamento HDD é apropriado para conjuntos de dados muito grandes (mais de 10 TB) não sensíveis à latência ou que são pouco acessados.

Independentemente do tipo de armazenamento que você escolher, os dados serão armazenados em um sistema de arquivos distribuído e replicado que se estende por muitas unidades físicas.

As diretrizes desta página podem ajudar você a escolher entre SSD e HDD.

Na dúvida, escolha o armazenamento SSD

Há várias razões pelas quais é melhor usar o armazenamento SSD em seu cluster do Cloud Bigtable:

  • O SSD é significativamente mais rápido e tem um desempenho mais previsível do que o HDD. Em um cluster do Cloud Bigtable, o armazenamento SSD oferece latências de 6 ms para leituras e gravações em 99% das solicitações. Por outro lado, o armazenamento HDD oferece latências de leitura de 200 ms e latências de gravação de 50 ms no mesmo comparativo de mercado.
  • A capacidade do HDD é muito mais limitada do que a do SSD. Em um cluster que usa armazenamento HDD, é fácil alcançar a taxa de transferência máxima antes de o uso da CPU atingir 100%. Para aumentar a capacidade, é preciso adicionar mais nós, mas o custo de nós adicionais pode facilmente estourar seu orçamento ao usar o armazenamento HDD. O armazenamento SSD não tem essa limitação, porque oferece muito mais capacidade por nó. Geralmente, um cluster que usa armazenamento SSD atinge o máximo da capacidade somente quando está usando toda a CPU e memória disponíveis.
  • As leituras de linha individuais no HDD são muito lentas. Devido ao tempo de busca do disco, o armazenamento do HDD é compatível apenas com 5% das linhas lidas por segundo de armazenamento SSD. No entanto, grandes verificações em várias linhas não são afetadas de maneira tão adversa.
  • As economias de custo com HDD são mínimas em relação ao custo dos nós no cluster do Cloud Bigtable, a menos que grandes quantidades de dados estejam sendo armazenadas. Por essa razão, como regra geral, não use armazenamento HDD, a menos que você esteja armazenando pelo menos 10 TB de dados.

Uma possível desvantagem do armazenamento SSD é que ele exige mais nodes nos clusters com base nos dados armazenados. Porém, na prática, talvez você precise de nodes extras. Dessa maneira, os clusters podem acompanhar o tráfego de entrada e não servirão apenas para dar suporte ao volume de dados que está armazenando.

Casos de uso para armazenamento HDD

O armazenamento HDD é adequado para casos de uso que atendem aos seguintes critérios:

  • Você espera armazenar pelo menos 10 TB de dados.
  • Você não usará os dados para auxiliar um aplicativo voltado para o usuário ou sensível à latência.
  • A carga de trabalho fica em uma das seguintes categorias:

    • Cargas de trabalho em lote com verificações e gravações, e não do que algumas leituras aleatórias de um número pequeno de linhas.
    • Arquivamento de dados, em que você grava volumes muito grandes de dados e raramente os lê.

Por exemplo, caso você pretenda armazenar dados históricos extensos para um grande número de dispositivos de detecção remota e use os dados para gerar relatórios diários, a economia no armazenamento HDD pode justificar a compensação do desempenho. Por outro lado, se você planeja usar os dados para exibir um painel em tempo real, provavelmente não faria sentido usar o armazenamento HDD, porque as leituras seriam muito mais frequentes neste caso, e elas são muito mais lentas com armazenamento HDD.

Como alternar o armazenamento SSD e HDD

Quando você cria um cluster e uma instância do Cloud Bigtable, a escolha entre armazenamento SSD ou HDD para o cluster é permanente. Não é possível usar o console do Google Cloud Platform para alterar o tipo de armazenamento usado para o cluster.

Caso seja necessário converter um cluster HDD atual em SSD ou vice-versa, exporte os dados da instância atual e importe-os para uma nova instância. Também é possível usar o Cloud Dataflow ou o job do Hadoop MapReduce para copiar os dados de uma instância para outra. Lembre-se de que migrar uma instância inteira demora e que talvez seja necessário adicionar nodes aos clusters do Cloud Bigtable antes de você migrar a instância.

Próximas etapas

Crie uma instância com armazenamento SSD ou HDD.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Cloud Bigtable