Data Boost の概要

Spanner Data Boost は、フルマネージドのサーバーレス サービスで、サポートされている Spanner ワークロードに独立したコンピューティング リソースを提供します。Data Boost を使用すると、プロビジョニングされた Spanner インスタンス上の既存のワークロードへの影響がほぼゼロの状態で、分析クエリとデータ エクスポートを実行できます。このサービスは、Google がリージョン レベルで管理する Spanner クラスタで構成されます。Data Boost をリクエストする有効なクエリの場合、Spanner はワークロードをこれらのサーバーに透過的にルーティングします。有効なクエリは、クエリ実行プランの最初の演算子が分散ユニオンであるクエリです。Data Boost を利用するために、これらのクエリを変更する必要はありません。

Data Boost は、リソース競合による既存のトランザクション システムに悪影響が及ばないようにする次のシナリオで、最も効果的です。

  • 大量のデータを扱うアドホック クエリまたはまれなクエリ。 典型的な例は、BigQuery から Spanner への連携クエリです。
  • レポートジョブまたはデータ エクスポート ジョブ。たとえば、Spanner データを Cloud Storage にエクスポートする Dataflow ジョブです。

次の図は、Data Boost が Spanner インスタンスと連携して独立したコンピューティング リソースを提供する方法を示しています。

Spanner アーキテクチャ内の Data Boost

利点

Data Boost には次のメリットがあります。

  • ワークロードの分離を行います。クエリの複雑さや処理されるデータの量に関係なく、既存のトランザクション ワークロードにほとんど影響することなく、最新のデータに対してサポートされているクエリを実行できます。
  • 同等以上のレイテンシを提供します。
  • ときどき分析クエリをサポートするためにのみ、Spanner インスタンスのオーバープロビジョニングを防ぎます。
  • バースト負荷に応じて柔軟にスケールできる、より大きなクエリ並列処理による高度なスケーラビリティを提供します。
  • 包括的な指標により、管理者は最もコストの高いクエリを特定し、最適化するコスト要素を決定できます。管理者は、クエリの次回の実行時のサーバーレス プロセッシング ユニットの消費量を監視することで、最適化の影響を検証できます。
  • 追加の運用オーバーヘッドは必要ありません。管理のための追加サービス、容量計画やプロビジョニング、スケーリングを待つ必要がなく、メンテナンスも不要です。

権限

Data Boost をリクエストするクエリまたはエクスポートを実行するプリンシパルには、spanner.databases.useDataBoost Identity and Access Management(IAM)権限が必要です。Cloud Spanner Database Readerroles/spanner.databaseReader)に基づいてカスタム IAM ロールを作成し、spanner.databases.useDataBoost を追加することをおすすめします。

課金と割り当て

料金は、Data Boost で実行されるクエリで使用される実際の処理ユニットに対してのみ発生します。管理者は、費用の超過を防ぐために使用量上限を設定できます。

次のステップ