Bigtable avec Dataproc

Bigtable est la base de données NoSQL big data de Google Google Cloud. Cette base de données est utilisée par de nombreux services Google principaux, y compris Recherche, Analytics, Maps et Gmail. Bigtable est conçu pour gérer d'importantes charges de travail en offrant constamment une latence faible et un débit élevé. Il s'agit donc d'un outil idéal pour les applications opérationnelles et analytiques, comme l'IoT, les analyses liées aux utilisateurs et les analyses de données financières.

Bigtable est une excellente option pour toutes les opérations basées sur Apache Spark ou Hadoop nécessitant Apache HBase. Bigtable est compatible avec Apache HBase 1.0+ et 2.0+, et propose un client HBase Bigtable dans Maven pour utiliser Bigtable avec Dataproc.

Utiliser le connecteur Bigtable Spark

Le connecteur Bigtable Spark vous permet de lire et d'écrire des données depuis et à Bigtable. Vous pouvez lire des données à partir de votre application Spark à l'aide de Spark SQL et de DataFrames. Pour les jobs en lecture seule, vous pouvez utiliser Calcul sans serveur Data Boost (preview) Data Boost est conçu pour répondre aux exigences de performances des jobs à haut débit et les requêtes, et d'éviter d'affecter votre cluster de diffusion d'applications lors de l'exécution de ces jobs et requêtes.

Pour en savoir plus, consultez la section Utiliser l'API Bigtable Spark d'entrée.

Étape suivante

  • Pour en savoir plus sur l'utilisation de Bigtable, consultez la Bigtable.