Bigtable avec Dataproc

Bigtable est le service de base de données NoSQL big data de Google. Cette base de données est utilisée par de nombreux services Google, tels que la recherche Google, Analytics, Maps et Gmail. Bigtable est conçu pour gérer d'importantes charges de travail en offrant constamment une latence faible et un débit élevé. Il s'agit donc d'un outil idéal pour les applications opérationnelles et analytiques, comme l'IoT, les analyses liées aux utilisateurs et les analyses de données financières.

Bigtable est une excellente option pour toutes les opérations basées sur Apache Spark ou Hadoop nécessitant Apache HBase. Bigtable est compatible avec les API Apache HBase 1.0+ et 2.0+, et propose un client HBase Bigtable dans Maven pour utiliser Bigtable avec Dataproc.

Utiliser le connecteur Bigtable Spark

Le connecteur Bigtable Spark vous permet de lire et d'écrire des données depuis et vers Bigtable. Vous pouvez lire des données depuis votre à l'aide de Spark SQL et des DataFrames. Pour les jobs en lecture seule, vous pouvez utiliser Calcul sans serveur Data Boost (preview) Data Boost est conçu pour répondre aux exigences de performances des jobs à haut débit et des requêtes, et d'éviter d'affecter votre cluster de diffusion d'applications lors de l'exécution de ces jobs et requêtes.

Pour en savoir plus, consultez la section Utiliser l'API Bigtable Spark d'entrée.

Étape suivante

  • Pour en savoir plus sur l'utilisation de Bigtable, consultez la Bigtable.