オプションの HBase コンポーネントのインストールは、イメージ バージョン 1.5 または 2.0 で作成された Dataproc クラスタに限定されます。
Google Cloud にはセルフマネージド Apache HBase をデプロイできる多くのサービスが用意されていますが、Bigtableは HBase とワークロードのポータビリティを備えたオープン API を提供するため、多くの場合最適な選択肢です。HBase データベース テーブルは、基盤となるデータを管理するために Bigtable に移行できます。一方、以前に HBase と相互運用していたアプリケーション(Spark など)は Dataproc に残し、Bigtable に安全に接続できます。このガイドでは、Bigtable の使用を開始するための概要と、Dataproc HBase デプロイメントから Bigtable にデータを移行するためのリファレンスを説明します。
Bigtable を使ってみる
Cloud Bigtable は、Apache HBase API クライアントの互換性と HBase ワークロードのポータビリティを提供する、高度にスケーラブルで高性能な NoSQL プラットフォームです。このクライアントは、HBase API のバージョン 1.x と 2.x に対応しており、Bigtable の読み取りと書き込みを行う既存のアプリケーションに含めることができます。既存の HBase アプリケーションでは、Bigtable HBase クライアント ライブラリを追加して、Bigtable に保存されているデータを読み書きできます。
Bigtable で HBase アプリケーションを構成する方法については、Bigtable と HBase API をご覧ください。
Bigtable クラスタの作成
Bigtable の使用を開始するには、以前に HBase に保存されていたデータを保存するクラスタとテーブルを作成します。HBase と同じスキーマを持つインスタンス、クラスタ、テーブルを作成するための Bigtable ドキュメントの手順に従います。HBase テーブル DDL からテーブルを自動的に作成する方法については、スキーマ変換ツールをご覧ください。
Google Cloud コンソールで Bigtable インスタンスを開き、テーブルとサーバーサイドのモニタリング グラフ(1 秒あたりの行数、レイテンシ、スループットなど)を表示して、新しくプロビジョニングされたテーブルを管理します。詳細については、モニタリングをご覧ください。
Dataproc から Bigtable にデータを移行する
Bigtable でテーブルを作成したら、Google Cloud 上の HBase を Bigtable に移行するのガイダンスに沿ってデータをインポートして検証できます。データを移行したら、Bigtable に読み取りと書き込みを送信するようにアプリケーションを更新できます。
次のステップ
- Bigtable で Spark を実行する方法については、Wordcount Spark の例をご覧ください。
- HBase から Bigtable へのライブ レプリケーションを使用してオンライン移行オプションを確認する。
- Box が NoSQL データベースをモダナイズした方法を参照して、その他のメリットについて理解する。