Bigtable mit Dataproc

Bigtable ist der NoSQL-Big-Data-Datenbankdienst von Google. Dieselbe Datenbank wird auch für viele der Hauptdienste von Google wie etwa die Google-Suche, Analytics, Maps und Gmail verwendet. Bigtable ist darauf ausgelegt, große Datenmengen bei konstant niedriger Latenz und hohem Durchsatz zu verarbeiten. Es eignet sich daher ideal für operative und analytische Anwendungen wie etwa IdD-Anwendungen, Nutzeranalysen und die Analyse von Finanzdaten.

Bigtable ist eine hervorragende Option für Apache Spark oder Hadoop, die Apache HBase erfordern. Bigtable unterstützt die Apache HBase 1.0+ APIs und bietet einen Bigtable-HBase-Client in Maven, sodass die Verwendung von Bigtable mit Dataproc einfach ist.

Bigtable mit Dataproc verwenden

Ein Spark-Beispiel, das Bigtable mit Dataproc verwendet, ist im java-docs-samples-Repository auf GitHub im Bigtable-Verzeichnis verfügbar.

Folgen Sie der Anleitung im Spark-Beispiel, um das Beispiel auszuführen. Klonen Sie zuerst das GitHub-Repository java-docs-samples.

git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
cd java-docs-samples/bigtable/spark

Weitere Informationen