Bigtable 与 Dataproc

Bigtable 是 Google 面向大数据领域的 NoSQL 数据库服务。它也是为 Google 搜索、Google Analytics、Google 地图和 Gmail 等众多核心 Google 服务提供支持的数据库。Bigtable 的设计目标是以稳定的低延迟和高吞吐性能处理巨量的工作负载,因此它是运营和分析型应用(包括 IoT、用户分析和金融数据分析)的理想之选。

对于任何需要 Apache HBase 的 Apache Spark 或 Hadoop 使用场景来说,Bigtable 都是出色的选择。Bigtable 支持 Apache HBase 1.0+ 和 2.0+ API,并且在 Maven 中提供了一个 Bigtable HBase 客户端,以便将 Bigtable 与 Dataproc 搭配使用。

使用 Bigtable Spark 连接器

借助 Bigtable Spark 连接器,您可以从 Bigtable 中读取数据以及向其中写入数据。您可以使用 Spark SQL 和 DataFrame 从 Spark 应用中读取数据。对于只读作业,您可以使用 Data Boost 无服务器计算(预览版)。Data Boost 专为满足高吞吐量作业和查询的性能要求而设计,可让您在运行这些作业和查询时避免影响应用服务集群流量。

如需了解详情,请参阅使用 Bigtable Spark 连接器

后续步骤

  • 如需详细了解如何使用 Bigtable,请参阅 Bigtable 文档。