L'installazione del componente facoltativo HBase è limitata ai cluster Dataproc creati con immagine versione 1.5 o 2.0.
Mentre Google Cloud offre molti servizi che consentono il deployment di Apache HBase autogestito, Bigtable è spesso l'opzione migliore, in quanto fornisce un'API aperta con HBase e portabilità dei carichi di lavoro. È possibile eseguire la migrazione delle tabelle di database HBase a Bigtable per la gestione dei dati sottostanti, mentre le applicazioni che in precedenza interoperavano con HBase, come Spark, possono rimanere su Dataproc e connettersi in modo sicuro a Bigtable. In questa guida vengono illustrati i passaggi generali per iniziare a utilizzare Bigtable e i riferimenti per la migrazione dei dati a Bigtable dai deployment di Dataproc HBase.
Inizia a utilizzare Bigtable
Cloud Bigtable è una piattaforma NoSQL ad alte prestazioni e scalabile che fornisce compatibilità del client dell'API Apache HBase e portabilità per i carichi di lavoro HBase. Il client è compatibile con le versioni 1.x e 2.x dell'API HBase e può essere incluso nell'applicazione esistente per la lettura e la scrittura in Bigtable. Le applicazioni HBase esistenti possono aggiungere la libreria client HBase di Bigtable per leggere e scrivere dati archiviati in Bigtable.
Per ulteriori informazioni sulla configurazione dell'applicazione HBase con Bigtable, consulta Bigtable e l'API HBase.
Crea un cluster Bigtable
Per iniziare a utilizzare Bigtable, puoi creare un cluster e delle tabelle per archiviare i dati precedentemente archiviati in HBase. Segui i passaggi nella documentazione di Bigtable per la creazione di un'istanza, un cluster e le tabelle con lo stesso schema delle tabelle HBase. Per la creazione automatica di tabelle da DDL di tabelle HBase, consulta lo strumento di conversione di schemi.
Apri l'istanza Bigtable nella console Google Cloud per visualizzare la tabella e i grafici di monitoraggio lato server, incluse le righe al secondo, la latenza e la velocità effettiva, per gestire la tabella di cui è stato eseguito il provisioning di recente. Per ulteriori informazioni, consulta Monitoring.
Migrazione dei dati da Dataproc a Bigtable
Dopo aver creato le tabelle in Bigtable, puoi importare e convalidare i dati seguendo le indicazioni nella migrazione di HBase da Google Cloud a Bigtable. Dopo aver eseguito la migrazione dei dati, puoi aggiornare le applicazioni in modo che inviino letture e scritture a Bigtable.
Passaggi successivi
- Consulta gli esempi di Wordcount Spark per l'esecuzione di Spark con Bigtable.
- Esamina le opzioni di migrazione online con la replica in tempo reale da HBase a Bigtable.
- Guarda How Box modernized their NoSQL database per comprendere altri vantaggi.