与 Cloud Bigtable 集成

本页面介绍 Cloud Bigtable 与其他产品和服务之间的集成。

Google Cloud Platform 服务

本部分介绍与 Cloud Bigtable 集成的 GCP 服务。

BigQuery

BigQuery 是 Google 推出的全面托管型低成本分析数据仓库,可提供 PB 级数据规模。您可以使用 BigQuery 查询 Cloud Bigtable 中存储的数据。

要开始使用 BigQuery,请参阅查询 Cloud Bigtable 数据

Cloud Dataflow

Cloud Dataflow 是一种云端服务和编程模型,适用于大数据处理。Cloud Dataflow 支持批处理和流式处理。您可以使用 Cloud Dataflow 处理 Cloud Bigtable 中存储的数据,或存储 Cloud Dataflow 流水线的输出。您还可以使用 Cloud Dataflow 模板将数据导出为 Hadoop 序列文件以及作为 Hadoop 序列文件导入

要开始使用 Cloud Dataflow,请参阅适用于 Cloud Bigtable 的 Dataflow 连接器

Cloud Dataproc

Cloud Dataproc 以云端托管服务形式提供了 Apache Hadoop 和相关产品。借助 Cloud Dataproc,您可以运行 Hadoop 作业来对 Cloud Bigtable 执行读写操作。

如需查看使用 Cloud Bigtable 的 Hadoop MapReduce 作业示例,请参阅 GitHub 代码库 GoogleCloudPlatform/cloud-bigtable-examples 中的 /java/dataproc-wordcount 目录。

Cloud Deployment Manager

Deployment Manager 是一种基础架构部署服务,可以自动创建和管理 GGP 资源。Deployment Manager 进行 API 调用以创建 Cloud Bigtable 实例,然后将其添加到您的部署中。

大数据

本部分介绍 Cloud Bigtable 可集成的各项 Big Data 产品。

Apache Hadoop

Apache Hadoop 是一种框架,可让您跨计算机集群对大型数据集进行分布式处理。您可以使用 Cloud Dataproc 创建 Hadoop 集群,然后运行 MapReduce 作业对 Cloud Bigtable 执行读写操作。

如需查看使用 Cloud Bigtable 的 Hadoop MapReduce 作业示例,请参阅 GitHub 代码库 GoogleCloudPlatform/cloud-bigtable-examples 中的 /java/dataproc-wordcount 目录。

StreamSets 数据收集器

StreamSet 数据收集器是一种数据流应用,您可以将其配置为将数据写入 Cloud Bigtable。StreamSets 在其 GitHub 代码库 streamsets / datacollector的 中提供 Cloud Bigtable 库。

地理空间数据库

本部分介绍了 Cloud Bigtable 可集成的地理空间数据库。

GeoMesa

GeoMesa 是一种分布式时空数据库,支持空间查询和数据操纵。GeoMesa 可以使用 Cloud Bigtable 存储其数据。

如需详细了解如何运行支持 Cloud Bigtable 的 GeoMesa,请参阅 GeoMesa 文档

图形数据库

本部分介绍了 Cloud Bigtable 可集成的图形数据库。

HGraphDB

HGraphDB 是使用 Apache HBase 或 Cloud Bigtable 作为图形数据库的客户端层。它实现了 Apache TinkerPop 3 接口。

如需详细了解如何运行带有 Cloud Bigtable 支持的 HGraphDB,请参阅 HGraphDB 文档

JanusGraph

JanusGraph 是一种可扩展的图形数据库。它最适用于存储和查询包含数千亿顶点和边的图形。

如需详细了解如何通过 Cloud Bigtable 支持运行 JanusGraph,请参阅使用 Cloud Bigtable 运行 JanusGraphJanusGraph 文档

基础架构管理

本部分介绍了 Cloud Bigtable 可集成的基础架构管理工具。

Pivotal Cloud Foundry

Pivotal Cloud Foundry 是一个应用开发和部署平台,可以将应用绑定到 Cloud Bigtable

Terraform

Terraform 是一种开源工具,可将 API 编码为声明式配置文件。您可以将这些文件分享给团队成员,将它们作为代码来处理,还可对它们进行修改、审核和版本控制。

如需详细了解如何将 Cloud Bigtable 与 Terraform 结合使用,请参阅 Terraform 文档中的 Cloud Bigtable 实例Cloud Bigtable 表

机器学习

盛宴

盛宴是一个用于机器学习的开源特征存储区,由 Google Cloud Platform 和 GO-JEK 开发,可以将 Cloud Bigtable 用作服务存储区。

TensorFlow

TensorFlow 是一个用于数值计算的开源库,为使用 Cloud Bigtable 存储和传送训练数据提供原生支持。使用 Cloud Bigtable 流式传输数据教程可帮助您了解如何使用此集成。

时间序列数据库和监控

本部分介绍 Cloud Bigtable 可集成的时间序列数据库和监控工具。

Heroic

Heroic 是一种监控系统和时间序列数据库。Heroic 可以使用 Cloud Bigtable 存储其数据。

如需详细了解 Heroic,请参阅 GitHub 代码库 spotify/heroic,以及配置 Cloud Bigtable配置指标的相关文档。

OpenTSDB

OpenTSDB 是一种时间序列数据库。借助 AsyncBigtable 库,OpenTSDB 可以使用 Cloud Bigtable 来存储其数据。

如需详细了解如何通过 Cloud Bigtable 支持运行 OpenTSDB,请参阅 Pythian 的博文OpenTSDB 文档。此外,请参阅使用 OpenTSDB 监控 Google Cloud Platform 上的时间序列数据,了解如何使用将 Google Kubernetes Engine 上运行的 OpenTSDB 与 Cloud Bigtable 搭配使用,以收集、记录和监控时间序列数据。