Componente HBase di Dataproc facoltativo

Puoi installare componenti aggiuntivi come HBase quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi in Dataproc versione 1.5 o Dataproc 2.0. Tuttavia, il componente Apache HBase non è consigliato per l'utilizzo su Dataproc a causa della natura temporanea dei cluster Dataproc.

Sebbene Google Cloud offra molti servizi che ti consentono di eseguire il deployment di Apache HHBase autogestito, Cloud Bigtable è spesso l'opzione migliore in quanto fornisce un'API aperta con HBase e portabilità dei carichi di lavoro. È possibile eseguire la migrazione delle tabelle dei database HBase in Bigtable per la gestione dei dati sottostanti, mentre le applicazioni che in precedenza interagivano con HBase, come Spark, possono rimanere su Dataproc e connettersi in modo sicuro a Bigtable. In questa guida forniamo i passaggi generali per iniziare a utilizzare Bigtable e forniamo riferimenti per la migrazione dei dati a Bigtable dai deployment di Dataproc HBase.

Inizia a utilizzare Bigtable

Cloud Bigtable è una piattaforma NoSQL a scalabilità elevata e dalle prestazioni elevate che offre compatibilità con il client API Apache Base e portabilità per i carichi di lavoro HBase. Il client è compatibile con le versioni 1.x e 2.x dell'API HBase e può essere incluso nell'applicazione esistente per la lettura e la scrittura in Bigtable. Le applicazioni HBase esistenti possono aggiungere la libreria client Bigtable HBase per leggere e scrivere dati archiviati in Bigtable.

Consulta Bigtable e l'API HBase per ulteriori informazioni sulla configurazione dell'applicazione HBase con Bigtable.

Crea un cluster Bigtable

Puoi iniziare a utilizzare Bigtable creando un cluster e delle tabelle per l'archiviazione dei dati precedentemente archiviati in HBase. Segui i passaggi nella documentazione di Bigtable per creare un'istanza, un cluster e tabelle con lo stesso schema delle tabelle HBase. Per la creazione automatica di tabelle dai DDL delle tabelle HBase, consulta lo strumento Traduttore di schemi.

Apri l'istanza Bigtable nella console Google Cloud per visualizzare la tabella e i grafici di monitoraggio lato server, incluse le righe al secondo, la latenza e la velocità effettiva, per gestire la tabella appena sottoposta a provisioning. Per ulteriori informazioni, consulta la pagina Monitoraggio.

Eseguire la migrazione dei dati da Dataproc a Bigtable

Dopo aver creato le tabelle in Bigtable, puoi importare e convalidare i dati seguendo le indicazioni riportate in Eseguire la migrazione di HBase da Google Cloud a Bigtable. Dopo aver eseguito la migrazione dei dati, puoi aggiornare le applicazioni per inviare operazioni di lettura e scrittura su Bigtable.

Passaggi successivi