Bigtable 与 Dataproc

Bigtable 是 Google 面向大数据领域的 NoSQL 数据库 服务。它也是为 Google 搜索、Google Analytics、Google 地图和 Gmail 等众多核心 Google 服务提供支持的数据库。Bigtable 旨在 以稳定的低延迟和高吞吐量处理海量工作负载, 非常适合运营和分析应用,包括 IoT、 用户分析和金融数据分析。

对于任何需要 Apache HBase 的 Apache Spark 或 Hadoop 使用场景来说,Bigtable 都是出色的选择。Bigtable 支持 Apache HBase 1.0+ 和 2.0+ API,并且在 Maven 中提供了一个 Bigtable HBase 客户端,以便将 Bigtable 与 Dataproc 搭配使用。

使用 Bigtable Spark 连接器

借助 Bigtable Spark 连接器,您可以从 和 Bigtable。你可以从 Spark 中读取数据 使用 Spark SQL 和 DataFrame 构建应用。对于只读作业,您可以使用 Data Boost 无服务器计算(预览版)。Data Boost 专为高吞吐量作业和查询的性能要求而设计,可让您在运行这些作业和查询时避免影响应用服务集群流量。

如需了解详情,请参阅使用 Bigtable Spark 连接器

后续步骤

  • 如需详细了解如何使用 Bigtable,请参阅 Bigtable 文档。