Dataproc の HBase オプション コンポーネント

オプションの HBase コンポーネントのインストールは、イメージ バージョン 1.5 または 2.0 で作成された Dataproc クラスタに限定されます。

Google Cloud にはセルフマネージド Apache HBase をデプロイできる多くのサービスが用意されていますが、Bigtableは HBase とワークロードのポータビリティを備えたオープン API を提供するため、多くの場合最適な選択肢です。HBase データベース テーブルは、基盤となるデータの管理のために Bigtable に移行できます。一方、以前に HBase と相互運用していたアプリケーション(Spark など)は、Dataproc に残して Bigtable と安全に接続できます。このガイドでは、Bigtable の使用を開始するための概要手順と、Dataproc HBase デプロイから Bigtable にデータを移行するためのリファレンスを提供します。

Bigtable を使ってみる

Cloud Bigtable は、Apache HBase API クライアントの互換性と HBase ワークロードの移植性を提供する、スケーラビリティとパフォーマンスに優れた NoSQL プラットフォームです。このクライアントは、HBase API のバージョン 1.x と 2.x に対応しており、既存のアプリケーションに含めて Bigtable の読み取りと書き込みを行うことができます。既存の HBase アプリケーションは、Bigtable に保存されたデータの読み取りと書き込みを行うために、Bigtable HBase クライアント ライブラリを追加できます。

Bigtable を使用して HBase アプリケーションを構成する方法については、Bigtable と HBase API をご覧ください。

Bigtable クラスタを作成する

Bigtable の使用を開始するには、以前に HBase に保存されていたデータを保存するためのクラスタとテーブルを作成します。HBase と同じスキーマを持つインスタンス、クラスタ、テーブルを作成するための Bigtable ドキュメントの説明に従います。HBase テーブルの DDL からテーブルを自動的に作成するには、スキーマ変換ツールをご覧ください。

Google Cloud コンソールで Bigtable インスタンスを開き、テーブルとサーバーサイドのモニタリング グラフ(1 秒あたりの行数、レイテンシ、スループットなど)を表示して、新しくプロビジョニングされたテーブルを管理します。詳細については、モニタリングをご覧ください。

Dataproc から Bigtable にデータを移行する

Bigtable でテーブルを作成したら、 Google Cloud の HBase から Bigtable への移行のガイダンスに沿って、データをインポートして検証できます。データを移行したら、Bigtable に読み取りと書き込みを送信するようにアプリケーションを更新できます。

次のステップ