Optionale HBase-Komponente für Dataproc

Die Installation der optionalen HBase-Komponente ist auf Dataproc-Cluster beschränkt, die mit der Image-Version 1.5 oder 2.0 erstellt wurden.

Google Cloud bietet viele Dienste, mit denen Sie selbstverwaltetes Apache HBase bereitstellen können. Bigtable ist jedoch oft die beste Option, da es eine offene API mit HBase und Workload-Portabilität bietet. HBase-Datenbanktabellen können zur Verwaltung der zugrunde liegenden Daten zu Bigtable migriert werden. Anwendungen, die zuvor mit HBase interagieren, z. B. Spark, können in Dataproc verbleiben und eine sichere Verbindung zu Bigtable herstellen. In diesem Leitfaden finden Sie eine allgemeine Anleitung für den Einstieg in Bigtable und Informationen zum Migrieren von Daten aus Dataproc-HBase-Bereitstellungen zu Bigtable.

Erste Schritte mit Bigtable

Cloud Bigtable ist eine hoch skalierbare und leistungsstarke NoSQL-Plattform, die Apache HBase API-Clientkompatibilität und Portabilität für HBase-Arbeitslasten bietet. Der Client ist mit den HBase API-Versionen 1.x und 2.x kompatibel und kann in der vorhandenen Anwendung enthalten sein, um Daten in Bigtable zu lesen und zu schreiben. Bestehende HBase-Anwendungen können die Bigtable HBase-Clientbibliothek hinzufügen, um in Bigtable gespeicherte Daten zu lesen und zu schreiben.

Weitere Informationen zum Konfigurieren Ihrer HBase-Anwendung mit Bigtable finden Sie unter Bigtable und die HBase API.

Bigtable-Cluster erstellen

Sie können mit Bigtable beginnen, indem Sie einen Cluster und Tabellen zum Speichern von Daten erstellen, die zuvor in HBase gespeichert waren. Folgen Sie der Anleitung in der Bigtable-Dokumentation zum Erstellen einer Instanz, eines Clusters und Tabellen mit demselben Schema wie die HBase-Tabellen. Informationen zum automatischen Erstellen von Tabellen aus HBase-Tabellen-DDLs finden Sie im Schemaübersetzungstool.

Öffnen Sie die Bigtable-Instanz in der Google Cloud -Konsole, um die Tabelle und serverseitige Überwachungsdiagramme wie Zeilen pro Sekunde, Latenz und Durchsatz aufzurufen und die neu bereitgestellte Tabelle zu verwalten. Weitere Informationen finden Sie unter Monitoring.

Daten von Dataproc zu Bigtable migrieren

Nachdem Sie die Tabellen in Bigtable erstellt haben, können Sie Ihre Daten importieren und validieren. Folgen Sie dazu der Anleitung unter HBase in Google Cloud zu Bigtable migrieren. Nachdem Sie die Daten migriert haben, können Sie Anwendungen so aktualisieren, dass Lese- und Schreibvorgänge an Bigtable gesendet werden.

Nächste Schritte