Bigtable は、Google が提供する NoSQL ビッグデータ データベース サービスで、これは、Google の多数の主要サービスを支えているのと同じデータベースです。検索、アナリティクス、マップ、Gmail などのサービスです。Bigtable は、低レイテンシ、高スループットを維持しつつ大量のワークロードを処理できるように設計されているため、IoT、ユーザー分析、金融データ解析など、データ操作用途でもデータ解析用途でも優れたツールとして機能します。
Bigtable は、Apache Spark や Hadoop で Apache HBase を必要とする用途に最適です。 Bigtable は、Apache HBase 1.0 以降と 2.0 以降の API をサポートし、Maven で Bigtable HBase クライアントを利用できるため、Dataproc で Bigtable を簡単に使用できます。
Bigtable Spark コネクタを使用する
Bigtable Spark コネクタを使用すると、Bigtable との間でデータを読み書きできます。Spark SQL と DataFrames を使用して Spark アプリケーション内からデータを読み取ることができます。読み取り専用ジョブには、Data Boost サーバーレス コンピューティング(プレビュー)を使用できます。Data Boost は、高スループットのジョブとクエリのパフォーマンス要件に合わせて設計されており、これらのジョブとクエリの実行時にアプリケーション サービング クラスタ トラフィックに影響を与えることはありません。
詳細については、Bigtable Spark コネクタを使用するをご覧ください。
次のステップ
- Bigtable の使用方法については、Bigtable のドキュメントをご覧ください。