Bigtable con Dataproc

Bigtable è il database di big data NoSQL di Google completamente gestito di Google Cloud. È lo stesso database su cui si basano molti dei principali servizi di Google, tra cui Ricerca, Analytics, Maps e Gmail. Bigtable è progettato per gestire grandi carichi di lavoro con bassa latenza coerente e velocità effettiva elevata, ed è perciò la scelta giusta per le applicazioni operative e analitiche, tra cui IoT, analisi utente e dei dati finanziari.

Bigtable è un'opzione eccellente per qualsiasi Apache Spark o Hadoop che richiedono Apache HBase. Bigtable supporta le API Apache HBase 1.0 e successive e 2.0 e successive e offre un client Bigtable HBase in Maven per utilizzare Bigtable con Dataproc.

Utilizzare il connettore Bigtable Spark

Il connettore Bigtable Spark ti consente di leggere e scrivere dati da e in Bigtable. Puoi leggere i dati dall'interno di Spark utilizzando Spark SQL e DataFrames. Per i job di sola lettura, puoi utilizzare Compute serverless Data Boost (anteprima), Data Boost è progettato per soddisfare i requisiti di prestazioni dei job a velocità effettiva elevata e query ed evita di influire sul cluster di distribuzione delle applicazioni il traffico quando vengono eseguiti i job e le query.

Per ulteriori informazioni, consulta Utilizzare il connettore Bigtable Spark.

Passaggi successivi

  • Per ulteriori informazioni sull'utilizzo di Bigtable, consulta documentazione di Bigtable.