Escolher entre armazenamento SSD e HDD
Ao criar uma instância do Bigtable, você escolhe se os clusters dela armazenam dados em unidades de estado sólido (SSD) ou unidades de disco rígido (HDD):
- O armazenamento SSD é a escolha mais eficiente e rentável para a maioria dos casos de uso.
- Às vezes, o armazenamento HDD é apropriado para grandes conjuntos de dados que não são sensíveis à latência ou são acessados com pouca frequência.
Independentemente do tipo de armazenamento que você escolher, os dados serão armazenados em um sistema de arquivos distribuído e replicado que se estende por muitas unidades físicas.
As diretrizes desta página podem ajudar você a escolher entre SSD e HDD.
Na dúvida, escolha o armazenamento SSD
Há vários motivos pelo qual é melhor usar o armazenamento SSD para seu cluster do Bigtable:
- O SSD é significativamente mais rápido e tem um desempenho mais previsível do que o HDD. Em um cluster do Bigtable, o armazenamento SSD oferece latências significativamente menores para leituras e gravações do que o armazenamento HDD.
- A capacidade do HDD é muito mais limitada que a do SSD. Em um cluster que usa o armazenamento HDD, é possível atingir a capacidade máxima antes que o uso da CPU atinja 100%. É possível monitorar esta situação usando a métrica de carregamento de disco. Para aumentar a capacidade, é preciso adicionar mais nós, mas o custo de nós adicionais pode facilmente estourar seu orçamento ao usar o armazenamento HDD. O armazenamento SSD não tem essa limitação, porque oferece muito mais capacidade por nó. Geralmente, um cluster que usa armazenamento SSD atinge o máximo da capacidade somente quando está usando toda a CPU e memória disponíveis.
- As leituras de linhas individuais no HDD são muito lentas. Devido ao tempo de busca do disco, o armazenamento do HDD é compatível apenas com 5% das linhas lidas por segundo de armazenamento SSD. No entanto, grandes verificações em várias linhas não são tão prejudicadas.
- A economia de custos com HDD é mínima em relação ao custo dos nós no cluster do Bigtable, a menos que você esteja armazenando quantidades grandes de dados. Por isso, como regra geral, não use o armazenamento HDD, a menos que você armazene pelo menos 10 TB de dados, e a carga de trabalho não seja sensível à latência.
Uma possível desvantagem do armazenamento SSD é que ele exige mais nodes nos clusters com base nos dados armazenados. Porém, na prática, talvez você precise de nodes extras. Dessa maneira, os clusters podem acompanhar o tráfego de entrada e não servirão apenas para dar suporte ao volume de dados que está armazenando.
Casos de uso de armazenamento HDD
O armazenamento HDD é adequado para casos de uso que atendem a todos estes critérios:
- Você espera armazenar pelo menos 10 TB de dados.
- Você não usará os dados para auxiliar um aplicativo voltado para o usuário ou sensível à latência.
A carga de trabalho fica em uma das seguintes categorias:
- Cargas de trabalho em lote com verificações e gravações, com leituras aleatórias de um pequeno número de leituras de linhas ou pontos.
- Arquivamento de dados, em que você grava grandes volumes de dados e raramente os lê.
Por exemplo, caso você pretenda armazenar dados históricos extensos para um grande número de dispositivos de detecção remota e use os dados para gerar relatórios diários, a economia no armazenamento HDD pode justificar a implicação no desempenho. Por outro lado, se você planeja usar os dados para exibir um painel em tempo real, provavelmente não faria sentido usar o armazenamento HDD, porque as leituras seriam muito mais frequentes neste caso, e as leituras que não são verificações são muito mais lentas com armazenamento HDD.
Troca entre armazenamento SSD e HDD
Quando você cria uma instância do Bigtable, a escolha de armazenamento SSD ou HDD para a instância é permanente. Não é possível usar o console do Google Cloud para alterar o tipo de armazenamento usado para a instância.
Para alterar o tipo de armazenamento da tabela, use o recurso de backups:
- Crie ou planeje usar uma instância que use o tipo de armazenamento desejado.
- Crie um backup da tabela.
- Faça a restauração do backup para uma nova tabela na outra instância.
A seguir
Crie uma instância com armazenamento SSD ou HDD.