Componente opcional do HBase do Dataproc

Descontinuado: a partir da versão 2.1 do Dataproc, não é mais possível usar o componente opcional do HBase.

A instalação do componente opcional do HBase é limitada a clusters do Dataproc criados com a versão de imagem 1.5 ou 2.0.

Embora o Google Cloud ofereça muitos serviços que permitem implantar o Apache HBase autogerenciado, o Bigtable é, muitas vezes, a melhor opção, porque oferece uma API aberta com o HBase e a portabilidade de carga de trabalho. As tabelas de banco de dados do HBase podem ser migradas para o Bigtable para gerenciamento dos dados subjacentes, enquanto os aplicativos que antes interagiam com o HBase, como o Spark, podem permanecer no Dataproc e se conectar com segurança ao Bigtable. Neste guia, apresentamos as etapas gerais para começar a usar o Bigtable e referências para migrar dados para o Bigtable de implantações do Dataproc HBase.

Começar a usar o Bigtable

O Cloud Bigtable é uma plataforma NoSQL altamente escalonável e com bom desempenho que oferece compatibilidade com o cliente da API Apache HBase e portabilidade para cargas de trabalho do HBase. O cliente é compatível com as versões 1.x e 2.x da API HBase e pode ser incluído no aplicativo atual para ler e gravar no Bigtable. Os aplicativos HBase atuais podem adicionar a biblioteca de cliente HBase do Bigtable para ler e gravar dados armazenados no Bigtable.

Consulte Bigtable e a API HBase para mais informações sobre como configurar seu aplicativo HBase com o Bigtable.

Criar um cluster do Bigtable

Para começar a usar o Bigtable, crie um cluster e tabelas para armazenar dados que foram armazenados anteriormente no HBase. Siga as etapas na documentação do Bigtable para criar uma instância, um cluster e tabelas com o mesmo esquema das tabelas do HBase. Para a criação automática de tabelas a partir de DDLs de tabela do HBase, consulte a ferramenta de tradução de esquema.

Abra a instância do Bigtable no console do Google Cloud para conferir a tabela e os gráficos de monitoramento do servidor, incluindo linhas por segundo, latência e capacidade, para gerenciar a tabela provisionada. Para mais informações, consulte Monitoramento.

Migrar dados do Dataproc para o Bigtable

Depois de criar as tabelas no Bigtable, você pode importar e validar seus dados seguindo as orientações em Migrar o HBase no Google Cloud para o Bigtable. Depois de migrar os dados, é possível atualizar os aplicativos para enviar leituras e gravações para o Bigtable.

A seguir