Escolha entre o armazenamento SSD e HDD
Quando cria uma instância do Bigtable, escolhe se os respetivos clusters armazenam dados em unidades de estado sólido (SSD) ou unidades de discos rígidos (HDD):
- O armazenamento SSD é a escolha mais eficiente e rentável para a maioria dos exemplos de utilização.
- O armazenamento em HDD é, por vezes, adequado para grandes conjuntos de dados que não são sensíveis à latência ou aos quais se acede com pouca frequência.
Independentemente do tipo de armazenamento que escolher, os seus dados são armazenados num sistema de ficheiros distribuído e replicado que abrange muitas unidades físicas.
As diretrizes nesta página podem ajudar a escolher entre SSD e HDD.
Em caso de dúvida, escolha o armazenamento SSD
Existem vários motivos pelos quais é geralmente melhor usar o armazenamento SSD para o seu cluster do Bigtable:
- O SSD é significativamente mais rápido e tem um desempenho mais previsível do que o HDD. Num cluster do Bigtable, o armazenamento SSD oferece latências significativamente mais baixas para leituras e escritas do que o armazenamento HDD.
- O débito do HDD é muito mais limitado do que o débito do SSD. Num cluster que usa armazenamento de HDD, é possível atingir o débito máximo antes de a utilização da CPU atingir 100%, uma situação que pode monitorizar através da métrica carga do disco. Para aumentar a taxa de transferência, tem de adicionar mais nós, mas o custo dos nós adicionais pode exceder as poupanças da utilização do armazenamento em HDD. O armazenamento SSD não tem esta limitação, porque oferece muito mais débito por nó. Geralmente, um cluster que usa armazenamento SSD atinge o débito máximo apenas quando está a usar toda a CPU e memória disponíveis.
- As leituras de linhas individuais no HDD são muito lentas. Devido ao tempo de procura no disco, o armazenamento em HDD suporta apenas 5% das linhas lidas por segundo do armazenamento em SSD. No entanto, as análises de várias linhas grandes não são tão afetadas negativamente.
- A poupança de custos dos HDDs é mínima em relação ao custo dos nós no cluster do Bigtable, a menos que esteja a armazenar grandes quantidades de dados. Por este motivo, como regra geral, não deve considerar usar o armazenamento em HDD, a menos que esteja a armazenar, pelo menos, 10 TB de dados e a sua carga de trabalho não seja sensível à latência.
Uma potencial desvantagem do armazenamento SSD é que requer mais nós nos seus clusters com base na quantidade de dados que armazena. No entanto, na prática, pode precisar desses nós adicionais para que os seus clusters possam acompanhar o tráfego recebido, não só para suportar a quantidade de dados que está a armazenar.
Exemplos de utilização do armazenamento HDD
O armazenamento em HDD é adequado para exemplos de utilização que cumprem todos os seguintes critérios:
- Espera armazenar, pelo menos, 10 TB de dados.
- Não vai usar os dados para suportar uma aplicação orientada para o utilizador ou sensível à latência.
- Não planeia ativar o dimensionamento de nós 2x.
A sua carga de trabalho enquadra-se numa das seguintes categorias:
- Processar cargas de trabalho em lote com leituras e escritas, e não mais do que leituras aleatórias ocasionais de um pequeno número de linhas ou leituras de pontos.
- Arquivo de dados, em que escreve grandes quantidades de dados e raramente lê esses dados.
Por exemplo, se planear armazenar dados do histórico extensos para um grande número de dispositivos de deteção remota e, em seguida, usar os dados para gerar relatórios diários, a poupança de custos do armazenamento em HDD pode justificar a compensação de desempenho. Por outro lado, se planear usar os dados para apresentar um painel de controlo em tempo real, não faz sentido usar o armazenamento HDD. As leituras seriam muito mais frequentes neste caso, e as leituras que não são verificações são muito mais lentas com o armazenamento HDD.
Alternar entre o armazenamento SSD e HDD
Quando cria uma instância do Bigtable, a sua escolha de armazenamento SSD ou HDD para a instância é permanente. Não pode usar a consolaGoogle Cloud para alterar o tipo de armazenamento usado para a instância.
Se quiser alterar o tipo de armazenamento em que uma tabela está armazenada, use a funcionalidade de cópias de segurança:
- Crie ou planeie usar uma instância que use o tipo de armazenamento pretendido.
- Crie uma cópia de segurança da tabela.
- Restaure a partir da cópia de segurança para uma nova tabela na outra instância.
O que se segue?
Crie uma instância com armazenamento SSD ou HDD.