將 Bigtable 搭配 Dataproc 使用

Bigtable 是 Google 的 NoSQL 大數據資料庫服務,這也是許多核心 Google 服務採用的資料庫,包括 Google 搜尋、Analytics、地圖和 Gmail。Bigtable 在處理大量工作負載時,能將延遲時間壓在低點,總處理量則維持在高檔,所以非常適合作業和分析用途,如 IoT、使用者分析和財務資料分析。

只要是需要 Apache HBase 的 Apache Spark 或 Hadoop 使用情境,無論是哪一種用途,Bigtable 都會是您的絕佳選擇。Bigtable 支援 Apache HBase 1.0+ 和 2.0+ API,並在 Maven 中提供 Bigtable HBase 用戶端,方便您搭配使用 Bigtable 與 Dataproc。

使用 Bigtable Spark 連接器

Bigtable Spark 連接器可讓您在 Bigtable 中讀取和寫入資料。您可以使用 Spark SQL 和 DataFrame,從 Spark 應用程式中讀取資料。如果是唯讀工作,可以使用 Data Boost 無伺服器運算。Data Boost 專為高處理量工作和查詢的效能需求而設計,可讓您在執行這些工作和查詢時,避免影響應用程式服務叢集流量。

詳情請參閱「使用 Bigtable Spark 連接器」。

後續步驟

  • 如要進一步瞭解如何使用 Bigtable,請參閱 Bigtable 說明文件。