Dataproc の HBase オプション コンポーネント

オプションの HBase コンポーネントのインストールは、イメージ バージョン 1.5 または 2.0 で作成された Dataproc クラスタに限定されます。

Google Cloud にはセルフマネージド Apache HBase をデプロイできる多くのサービスが用意されていますが、Bigtableは HBase とワークロードのポータビリティを備えたオープン API を提供するため、多くの場合最適な選択肢です。HBase データベース テーブルを Bigtable に移行して、基礎となるデータを管理できます。一方、以前に HBase と相互運用していたアプリケーション(Spark など)は Dataproc 上に残り、Bigtable と安全に接続できます。このガイドでは、Bigtable の使用を開始するための大まかな手順について説明し、Dataproc HBase デプロイから Bigtable にデータを移行するためのリファレンスを示します。

Bigtable を使ってみる

Cloud Bigtable はスケーラビリティとパフォーマンスに優れた NoSQL プラットフォームで、Apache HBase API クライアントの互換性と HBase ワークロードのポータビリティを提供します。このクライアントは HBase API のバージョン 1.x と 2.x と互換性があり、Bigtable に対する読み取りと書き込みのために既存のアプリケーションに組み込まれる可能性があります。既存の HBase アプリケーションでは、Bigtable HBase クライアント ライブラリを追加して、Bigtable に保存されているデータを読み書きできます。

Bigtable を使用して HBase アプリケーションを構成する方法については、Bigtable と HBase API をご覧ください。

Bigtable クラスタの作成

Bigtable の使用を開始するには、HBase に以前に保存されていたデータを格納するためのクラスタとテーブルを作成します。HBase と同じスキーマを持つインスタンス、クラスタ、テーブルを作成するための Bigtable ドキュメントの手順に従います。HBase テーブルの DDL からテーブルを自動的に作成する方法については、スキーマ変換ツールをご覧ください。

Google Cloud コンソールで Bigtable インスタンスを開き、テーブルとサーバーサイドのモニタリング グラフ(1 秒あたりの行数、レイテンシ、スループットなど)を表示して、新しくプロビジョニングされたテーブルを管理します。詳細については、モニタリングをご覧ください。

Dataproc から Bigtable へのデータの移行

Bigtable でテーブルを作成したら、Google Cloud 上の HBase を Bigtable に移行するのガイダンスに沿ってデータをインポートして検証できます。データを移行したら、Bigtable に読み取りと書き込みを送信するようにアプリケーションを更新できます。

次のステップ