Dataproc 選用 HBase 元件

選用 HBase 元件只能安裝在以映像檔版本 1.52.0 建立的 Dataproc 叢集。

雖然 Google Cloud 提供許多服務,可讓您部署自行管理的 Apache HBase,但 Bigtable 通常是最佳選擇,因為它提供與 HBase 相容的開放式 API,且工作負載可攜性高。您可以將 HBase 資料庫資料表遷移至 Bigtable,以便管理基礎資料,而先前與 HBase 互通的應用程式 (例如 Spark) 則可留在 Dataproc,並安全地連線至 Bigtable。本指南提供 Bigtable 入門的高階步驟,並提供參考資料,說明如何從 Dataproc HBase 部署作業將資料遷移至 Bigtable。

開始使用 Bigtable

Cloud Bigtable 是高度可擴充且效能優異的 NoSQL 平台,可與 Apache HBase API 用戶端相容,並提供 HBase 工作負載的可攜性。這個用戶端與 HBase API 1.x 和 2.x 版相容,可納入現有應用程式,以便讀取及寫入 Bigtable。現有的 HBase 應用程式可以新增 Bigtable HBase 用戶端程式庫,讀取及寫入儲存在 Bigtable 中的資料。

如要進一步瞭解如何使用 Bigtable 設定 HBase 應用程式,請參閱「Bigtable 和 HBase API」。

建立 Bigtable 叢集

您可以建立叢集和資料表,開始使用 Bigtable 儲存先前儲存在 HBase 中的資料。請按照 Bigtable 說明文件中的步驟,建立執行個體、叢集和資料表,並使用與 HBase 資料表相同的結構定義。如要從 HBase 資料表 DDL 自動建立資料表,請參閱結構定義轉換工具

在 Google Cloud 控制台中開啟 Bigtable 執行個體,即可查看資料表和伺服器端監控圖表 (包括每秒資料列數、延遲時間和輸送量),以便管理新佈建的資料表。詳情請參閱「監控」。

將資料從 Dataproc 遷移至 Bigtable

在 Bigtable 中建立資料表後,請按照「將 HBase 遷移至 Bigtable」 Google Cloud 的指南匯入及驗證資料。遷移資料後,您可以更新應用程式,將讀取和寫入作業傳送至 Bigtable。

後續步驟