費用の見積もりと管理

このページでは、BigQuery での費用の見積りと管理のベストプラクティスについて説明します。

BigQuery の主な費用は、クエリ処理に使用されるコンピューティングと、BigQuery に保存されるデータのストレージです。BigQuery には、クエリ処理用のオンデマンドと容量ベースの 2 種類の料金モデルがあります。各モデルで、費用管理に関するベストプラクティスは異なります。BigQuery に保存されているデータの場合、費用は各データセットに構成されたストレージ課金モデルによって異なります。

BigQuery のコンピューティング料金について

BigQuery のコンピューティング料金には、容量計画と費用管理に影響する微妙な違いがあります。

料金モデル

BigQuery のオンデマンドコンピューティングの場合、BigQuery クエリに対して TiB あたりの料金が発生します。

一方、BigQuery の容量コンピューティングでは、クエリの処理に使用されるコンピューティングリソース（スロット）に対して料金が発生します。このモデルを使用するには、スロットの予約を構成します。

予約には次の機能があります。

スロットのプールで割り当てられ、組織にとって有益な方法で容量を管理し、ワークロードを分離できます。
1 つの管理プロジェクトに存在する必要があり、割り当てと上限が適用されます。

容量ベースの料金モデルには、いくつかのエディションがあります。いずれも、スロット時間単位で課金される従量課金制オプションが用意されています。Enterprise エディションと Enterprise Plus エディションでは、1 年または 3 年のスロットコミットメントもオプションで提供されており、従量課金制の料金よりも費用を節約できます。

また、従量課金制オプションを使用して自動スケーリング予約を設定することもできます。詳しくは次の記事をご覧ください。

料金モデルを比較するには、モデルの選択をご覧ください。
料金の詳細については、オンデマンドコンピューティングの料金と容量コンピューティングの料金をご覧ください。

モデルごとに費用を制限する

オンデマンド料金モデルを使用する場合、費用を制限する唯一の方法は、プロジェクトレベルまたはユーザーレベルの 1 日あたりの割り当てを構成することです。ただし、これらの割り当てにはハードキャップが適用され、ユーザーが割り当て上限を超えるクエリを実行できなくなります。割り当てを設定するには、カスタムクエリの割り当てを作成するをご覧ください。

スロット予約を使用して定額料金モデルを使用する場合は、予約で使用できるスロットの最大数を指定します。確約期間中は割引価格で利用できるスロットコミットメントを購入することもできます。

エディションを完全にオンデマンドで使用するには、予約のベースラインを 0 に設定し、最大値をワークロードのニーズを満たす設定にします。BigQuery は、ワークロードに必要なスロット数まで自動的にスケールアップします。設定した最大数を超えることはありません。詳細については、予約を使用したワークロード管理をご覧ください。

クエリ費用を管理する

個々のクエリの費用を抑えるには、まずクエリ計算の最適化とストレージの最適化のベストプラクティスに沿うことをおすすめします。

以降のセクションでは、クエリ費用をさらに抑えるために使用できるその他のベストプラクティスについて説明します。

カスタムのクエリ割り当てを作成する

ベストプラクティス: 1 日あたりのカスタムのクエリ割り当てを使用して、1 日に処理されるデータの量を制限します。

プロジェクトまたはユーザーあたりの 1 日あたりの処理データ量の上限を指定するカスタム割り当てを設定することで、費用を管理できます。割り当てに達すると、ユーザーはクエリを実行できなくなります。

カスタム割り当てを設定するには、特定のロールまたは権限が必要です。設定する割り当てについては、割り当てと上限をご覧ください。

詳細については、各料金モデルの費用を制限するをご覧ください。

クエリを実行する前に見積もり費用を確認する

ベストプラクティス: クエリを実行する前に、プレビューして費用を見積もります。

オンデマンド料金モデルを使用する場合、クエリは読み取られたバイト数に基づいて課金されます。クエリを実行する前に費用を見積もるには:

Google Cloud コンソールでクエリ検証ツールを使用します。
クエリのドライランを実行します。

クエリ検証ツールを使用する

Google Cloud コンソールでクエリを入力すると、クエリ検証ツールがクエリ構文を検証し、読み取られるバイト数を見積もります。この見積もりを使用して、料金計算ツールでクエリ費用を計算できます。

クエリが無効な場合は、クエリ検証ツールにエラーメッセージが表示されます。例:

Not found: Table myProject:myDataset.myTable was not found in location US
クエリが有効な場合は、クエリ検証ツールによりクエリ処理に必要なバイト数の見積もりが提供されます。次に例を示します。

This query will process 623.1 KiB when run.

ドライランの実行

ドライランを実行するには、次の操作を行います。

コンソール

BigQuery ページに移動します。

[BigQuery] に移動
クエリエディタにクエリを入力します。

クエリが有効な場合、クエリで処理されるデータの量とともにチェックマークが自動的に表示されます。クエリが無効な場合は、感嘆符がエラーメッセージとともに表示されます。

bq

--dry_run フラグを使用して次のようなクエリを入力します。

bq query \
--use_legacy_sql=false \
--dry_run \
'SELECT
   COUNTRY,
   AIRPORT,
   IATA
 FROM
   `project_id`.dataset.airports
 LIMIT
   1000'

有効なクエリの場合、このコマンドによって次のレスポンスが生成されます。

Query successfully validated. Assuming the tables are not modified,
running this query will process 10918 bytes of data.

API

API を使用してドライランを実行するには、JobConfiguration タイプで dryRun を true に設定してクエリジョブを送信します。

Go

このサンプルを試す前に、クライアントライブラリを使用した BigQuery クイックスタートにある Go の設定手順を完了してください。詳細については、BigQuery Go API のリファレンスドキュメントをご覧ください。

BigQuery に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、クライアントライブラリの認証情報を設定するをご覧ください。

import (
	"context"
	"fmt"
	"io"

	"cloud.google.com/go/bigquery"
)

// queryDryRun demonstrates issuing a dry run query to validate query structure and
// provide an estimate of the bytes scanned.
func queryDryRun(w io.Writer, projectID string) error {
	// projectID := "my-project-id"
	ctx := context.Background()
	client, err := bigquery.NewClient(ctx, projectID)
	if err != nil {
		return fmt.Errorf("bigquery.NewClient: %v", err)
	}
	defer client.Close()

	q := client.Query(`
	SELECT
		name,
		COUNT(*) as name_count
	FROM ` + "`bigquery-public-data.usa_names.usa_1910_2013`" + `
	WHERE state = 'WA'
	GROUP BY name`)
	q.DryRun = true
	// Location must match that of the dataset(s) referenced in the query.
	q.Location = "US"

	job, err := q.Run(ctx)
	if err != nil {
		return err
	}
	// Dry run is not asynchronous, so get the latest status and statistics.
	status := job.LastStatus()
	if err := status.Err(); err != nil {
		return err
	}
	fmt.Fprintf(w, "This query will process %d bytes\n", status.Statistics.TotalBytesProcessed)
	return nil
}

Java

このサンプルを試す前に、クライアントライブラリを使用した BigQuery クイックスタートにある Java の設定手順を完了してください。詳細については、BigQuery Java API のリファレンスドキュメントをご覧ください。

import com.google.cloud.bigquery.BigQuery;
import com.google.cloud.bigquery.BigQueryException;
import com.google.cloud.bigquery.BigQueryOptions;
import com.google.cloud.bigquery.Job;
import com.google.cloud.bigquery.JobInfo;
import com.google.cloud.bigquery.JobStatistics;
import com.google.cloud.bigquery.QueryJobConfiguration;

// Sample to run dry query on the table
public class QueryDryRun {

  public static void runQueryDryRun() {
    String query =
        "SELECT name, COUNT(*) as name_count "
            + "FROM `bigquery-public-data.usa_names.usa_1910_2013` "
            + "WHERE state = 'WA' "
            + "GROUP BY name";
    queryDryRun(query);
  }

  public static void queryDryRun(String query) {
    try {
      // Initialize client that will be used to send requests. This client only needs to be created
      // once, and can be reused for multiple requests.
      BigQuery bigquery = BigQueryOptions.getDefaultInstance().getService();

      QueryJobConfiguration queryConfig =
          QueryJobConfiguration.newBuilder(query).setDryRun(true).setUseQueryCache(false).build();

      Job job = bigquery.create(JobInfo.of(queryConfig));
      JobStatistics.QueryStatistics statistics = job.getStatistics();

      System.out.println(
          "Query dry run performed successfully." + statistics.getTotalBytesProcessed());
    } catch (BigQueryException e) {
      System.out.println("Query not performed \n" + e.toString());
    }
  }
}

Node.js

このサンプルを試す前に、クライアントライブラリを使用した BigQuery クイックスタートにある Node.js の設定手順を完了してください。詳細については、BigQuery Node.js API のリファレンスドキュメントをご覧ください。

// Import the Google Cloud client library
const {BigQuery} = require('@google-cloud/bigquery');
const bigquery = new BigQuery();

async function queryDryRun() {
  // Runs a dry query of the U.S. given names dataset for the state of Texas.

  const query = `SELECT name
    FROM \`bigquery-public-data.usa_names.usa_1910_2013\`
    WHERE state = 'TX'
    LIMIT 100`;

  // For all options, see https://cloud.google.com/bigquery/docs/reference/rest/v2/jobs/query
  const options = {
    query: query,
    // Location must match that of the dataset(s) referenced in the query.
    location: 'US',
    dryRun: true,
  };

  // Run the query as a job
  const [job] = await bigquery.createQueryJob(options);

  // Print the status and statistics
  console.log('Status:');
  console.log(job.metadata.status);
  console.log('\nJob Statistics:');
  console.log(job.metadata.statistics);
}

PHP

このサンプルを試す前に、クライアントライブラリを使用した BigQuery クイックスタートにある PHP の設定手順を完了してください。詳細については、BigQuery PHP API のリファレンスドキュメントをご覧ください。

use Google\Cloud\BigQuery\BigQueryClient;

/** Uncomment and populate these variables in your code */
// $projectId = 'The Google project ID';
// $query = 'SELECT id, view_count FROM `bigquery-public-data.stackoverflow.posts_questions`';

// Construct a BigQuery client object.
$bigQuery = new BigQueryClient([
    'projectId' => $projectId,
]);

// Set job configs
$jobConfig = $bigQuery->query($query);
$jobConfig->useQueryCache(false);
$jobConfig->dryRun(true);

// Extract query results
$queryJob = $bigQuery->startJob($jobConfig);
$info = $queryJob->info();

printf('This query will process %s bytes' . PHP_EOL, $info['statistics']['totalBytesProcessed']);

Python

QueryJobConfig.dry_run プロパティを True に設定します。ドライランのクエリ構成が渡されると、Client.query() は常に完了した QueryJob を返します。

このサンプルを試す前に、クライアントライブラリを使用した BigQuery クイックスタートにある Python の設定手順を完了してください。詳細については、BigQuery Python API のリファレンスドキュメントをご覧ください。

from google.cloud import bigquery

# Construct a BigQuery client object.
client = bigquery.Client()

job_config = bigquery.QueryJobConfig(dry_run=True, use_query_cache=False)

# Start the query, passing in the extra configuration.
query_job = client.query(
    (
        "SELECT name, COUNT(*) as name_count "
        "FROM `bigquery-public-data.usa_names.usa_1910_2013` "
        "WHERE state = 'WA' "
        "GROUP BY name"
    ),
    job_config=job_config,
)  # Make an API request.

# A dry run query completes immediately.
print("This query will process {} bytes.".format(query_job.total_bytes_processed))

クエリの費用を見積もる

オンデマンド料金モデルを使用している場合は、処理されるバイト数を計算することで、クエリの実行費用を見積もることができます。

オンデマンドクエリのサイズの計算

さまざまなタイプのクエリで処理されるバイト数を計算するには、以降のセクションをご覧ください。

テーブルデータを探索するためにクエリを実行しない

ベストプラクティス: テーブルデータを探索またはプレビューするためにクエリを実行しないでください。

データの試用や探索を行う場合は、テーブルプレビューオプションを使用すれば、割り当てに影響を与えることなく、無料でデータを表示できます。

BigQuery は、次のデータプレビューオプションをサポートしています。

Google Cloud コンソールのテーブルの詳細ページで、[プレビュー] タブをクリックしてデータをサンプリングします。
bq コマンドラインツールで bq head コマンドを使用して、プレビューする行数を指定する。
API で tabledata.list を使用して、指定した行のセットからテーブルデータを取得する。
クラスタ化されていないテーブルでは LIMIT を使用しない。クラスタ化されていないテーブルの場合は、LIMIT 句によってコンピューティング費用が削減されません。

クエリあたりの課金対象バイト数を制限する

ベストプラクティス: オンデマンド料金モデルを使用する場合は、課金される最大バイト数を設定してクエリ費用を抑えます。

課金されるクエリのバイト数を制限するには、課金される最大バイト数の設定を使用します。この設定を行うと、クエリが実行される前に、クエリで読み取られるバイト数が推定されます。推定バイト数が上限を超えると、クエリが失敗し、料金は発生しません。

クラスタ化テーブルの場合、クエリに対して課金されるバイト数の推定値は上限値になります。クエリ実行後に請求される実際のバイト数より高くなることがあります。そのため、課金対象の最大バイト数を設定すると、課金される実際のバイト数が課金対象の最大バイト数を超えなくても、クラスタ化テーブルに対するクエリが失敗する場合があります。

課金される最大バイト数を設定したことによってクエリが失敗した場合は、次のようなエラーが返されます。

Error: Query exceeded limit for bytes billed: 1000000. 10485760 or higher required.

課金される最大バイト数を設定するには:

コンソール

クエリエディタで、[展開] > [クエリ設定] > [詳細オプション] の順にクリックします。
[課金される最大バイト数] フィールドに整数を入力します。
[保存] をクリックします。

bq

bq query コマンドを使用し、--maximum_bytes_billed フラグを指定します。

  bq query --maximum_bytes_billed=1000000 \
  --use_legacy_sql=false \
  'SELECT
     word
   FROM
     `bigquery-public-data`.samples.shakespeare'

API

JobConfigurationQuery または QueryRequest で maximumBytesBilled プロパティを設定します。

クラスタ化されていないテーブルでは `LIMIT` を使用しない

おすすめの方法: クラスタ化されていないテーブルでは、費用を管理する手法として LIMIT 句を使用しないでください。

クラスタ化されていないテーブルの場合、LIMIT 句をクエリに適用しても、読み取られるデータの量には影響しません。クエリがサブセットのみを返す場合でも、クエリで示されているテーブル全体のすべてのバイトの読み取りに対して課金されます。クラスタ化テーブルでは、結果を取得するために十分なブロックがスキャンされるとスキャンが停止するため、LIMIT 句でスキャンできるバイト数を減らすことができます。スキャンされたバイトに対してのみ課金されます。

クエリ結果を段階的に実体化する

おすすめの方法: 可能であれば、クエリ結果を段階的に実体化します。

大容量のマルチステージクエリを作成すると、それを実行するたびに、BigQuery がそのクエリに必要なすべてのデータを読み取ります。クエリが実行されるたびに読み取られるすべてのデータに対して課金されます。

代わりに、クエリを複数のステージに分割し、各ステージでクエリ結果を宛先テーブルに書き込むことにより実体化します。小容量の宛先テーブルを照会することにより、読み取られるデータの量が削減され、費用が削減されます。実体化された結果を保存する費用は、大量のデータを処理する費用よりはるかに少なくなります。

ワークロードの費用を管理する

このセクションでは、ワークロード内で費用を抑えるためのベストプラクティスについて説明します。ワークロードは関連する一連のクエリです。たとえば、ワークロードには、毎日実行されるデータ変換パイプライン、ビジネスアナリストのグループによって実行される一連のダッシュボード、データサイエンティストのグループによって実行される複数のアドホッククエリなどがあります。

Google Cloud 料金計算ツールを使用する。

ベストプラクティス: Google Cloud 料金計算ツールを使用して、予想使用量に基づいて BigQuery の 1 か月の費用の見積もりを作成します。この見積もりを実際の費用と比較して、最適化の対象となる領域を特定できます。

オンデマンド

オンデマンド料金モデルを使用している場合に Google Cloud 料金計算ツールで費用を見積もる手順は、次のとおりです。

Google Cloud 料金計算ツールを開きます。
[Add To Estimate] をクリックします。
[BigQuery] を選択します。
[サービスタイプ] で [オンデマンド] を選択します。
クエリを実行するロケーションを選択します。
[クエリされたデータ量] に、ドライランまたはクエリ検証ツールから返された推定読み取りバイト数を入力します。
アクティブストレージ、長期ストレージ、ストリーミング挿入、ストリーミング読み取りの推定ストレージ使用量を入力します。データセットストレージの課金モデルに応じて、物理ストレージまたは論理ストレージのいずれかを推定する必要があります。
見積もりは [費用の詳細] パネルに表示されます。推定費用の詳細を確認するには、[詳細ビューを開く] をクリックします。費用見積もりをダウンロードして共有することもできます。

詳しくは、オンデマンド料金をご覧ください。

エディション

BigQuery エディションで容量ベースの料金モデルを使用している場合に、Google Cloud 料金計算ツールで費用を見積もる手順は次のとおりです。

Google Cloud 料金計算ツールを開きます。
[Add To Estimate] をクリックします。
[BigQuery] を選択します。
[サービスタイプ] で [エディション] を選択します。
スロットを使用するロケーションを選択します。
ご使用のエディションを選択します。
[Maximum slots]、[Baseline slots]、[Commitment]、[Estimated utilization of autoscaling] で該当する値を選択します。
データを保存するロケーションを選択します。
アクティブストレージ、長期ストレージ、ストリーミング挿入、ストリーミング読み取りの推定ストレージ使用量を入力します。データセットストレージの課金モデルに応じて、物理ストレージまたは論理ストレージのいずれかを推定する必要があります。
見積もりは [費用の詳細] パネルに表示されます。推定費用の詳細を確認するには、[詳細ビューを開く] をクリックします。費用見積もりをダウンロードして共有することもできます。

詳細については、容量ベースの料金をご覧ください。

予約とコミットメントを使用する

ベストプラクティス: BigQuery の予約とコミットメントを使用して費用を管理します。

詳細については、各料金モデルの費用を制限するをご覧ください。

スロット見積もりツールを使用する

ベストプラクティス: スロット見積もりツールを使用して、ワークロードに必要なスロット数を見積もります。

BigQuery スロット見積もりツールを使用すると、過去のパフォーマンス指標に基づいてスロット容量を管理できます。

また、オンデマンド料金モデルを使用しているお客様は、容量ベースの料金に移行する際に、同様のパフォーマンスのコミットメントと自動スケーリングの予約のサイズ設定に関する推奨事項を確認できます。

不要な長時間実行ジョブをキャンセルする

容量を解放するには、長時間実行ジョブが実行を続行する必要があるかどうかを確認します。必要ない場合は、キャンセルします。

ダッシュボードを使用して費用を表示する

ベストプラクティス: BigQuery の使用量をモニタリングして調整できるように、Cloud Billing データを分析するダッシュボードを作成します。

課金データを BigQuery にエクスポートして、Looker Studio などのツールで可視化できます。課金ダッシュボードの作成方法のチュートリアルについては、BigQuery と Looker Studio を使用した Google Cloud 課金の可視化をご覧ください。

課金の予算とアラートを使用する

ベストプラクティス: Cloud Billing 課金の予算を使用して、BigQuery の料金を 1 か所でモニタリングします。

Cloud Billing の予算を使用すると、実際の費用を予定費用と照らし合わせて追跡できます。予算額を設定したら、メール通知のトリガーに使用する予算アラートしきい値のルールを設定します。予算アラートのメールにより、予算に対する BigQuery 費用の追跡に関する最新情報を常に取得できます。

ストレージ費用を管理する

BigQuery ストレージの費用を最適化するには、次のベストプラクティスを使用します。クエリパフォーマンスのストレージを最適化することもできます。

長期ストレージを使用する

ベストプラクティス: 長期ストレージの料金を使用して、古いデータの費用を削減します。

BigQuery ストレージにデータを読み込むと、そのデータには BigQuery のストレージ料金が適用されます。古いデータの場合は、BigQuery の長期保存の料金を自動的に利用できます。

90 日間連続して変更されていないテーブルがある場合、そのテーブルのストレージ料金は自動的に 50% 減少します。パーティション分割テーブルがある場合、各パーティションは、パーティション分割されていないテーブルと同じルールに従って、長期料金の対象となるかどうか個別に検討されます。

ストレージの課金モデルを構成する

ベストプラクティス: 使用パターンに基づいてストレージの課金モデルを最適化します。

BigQuery は、論理バイト（非圧縮）、物理バイト（圧縮）、またはその両方の組み合わせによるストレージ課金をサポートしています。各データセットに構成されたストレージ課金モデルによってストレージの料金が変化しますが、クエリのパフォーマンスには影響しません。

INFORMATION_SCHEMA ビューを使用すると、使用パターンに基づいて最適なストレージ課金モデルを特定できます。

テーブルの上書きを避ける

ベストプラクティス: 物理ストレージの課金モデルを使用している場合は、テーブルを繰り返し上書きしないでください。

バッチ読み込みジョブで --replace パラメータを使用するか、TRUNCATE TABLE SQL ステートメントを使用してテーブルを上書きすると、置換されたデータはタイムトラベルとフェイルセーフのウィンドウの期間保持されます。テーブルを上書きする頻度が高いと、追加のストレージ料金が発生します。

代わりに、読み込みジョブの WRITE_APPEND パラメータ、MERGE SQL ステートメント、またはストレージ書き込み API を使用して、テーブルにデータを段階的に読み込むことができます。

タイムトラベル期間を短縮する

ベストプラクティス: 要件に応じて、タイムトラベル期間を短縮できます。

タイムトラベル期間をデフォルト値の 7 日から短縮すると、テーブルから削除または変更されたデータの保持期間が短縮されます。タイムトラベルストレージの料金は、物理（圧縮）ストレージの課金モデルを使用している場合にのみ発生します。

タイムトラベル期間はデータセットレベルで設定されます。構成設定を使用して、新しいデータセットのデフォルトのタイムトラベル期間を設定することもできます。

宛先テーブルにテーブルの有効期限を使用する

おすすめの方法: 大容量のクエリ結果を宛先テーブルに書き込む場合は、デフォルトのテーブル有効期限を適用して不要になったデータを削除します。

BigQuery ストレージでラージアウトプットセットを維持するには費用がかかります。結果に永続的にアクセスする必要がなければ、デフォルトのテーブル有効期限を使用して自動的にデータを削除するようにします。

Cloud Storage にデータをアーカイブする

ベストプラクティス: Cloud Storage にデータをアーカイブすることを検討します。

アーカイブのビジネスニーズに応じて、BigQuery から Cloud Storage にデータを移動できます。BigQuery からデータをエクスポートする前に、長期ストレージの料金と物理ストレージの課金モデルを検討することをおすすめします。

次のステップ

BigQuery の料金を確認する。
クエリを最適化する方法を学習する。
ストレージを最適化する方法を学習する。
課金、アラート、データの可視化について詳しくは、次のトピックをご覧ください。

費用の見積もりと管理

BigQuery のコンピューティング料金について

料金モデル

モデルごとに費用を制限する

クエリ費用を管理する

カスタムのクエリ割り当てを作成する

クエリを実行する前に見積もり費用を確認する

クエリ検証ツールを使用する

ドライランの実行

コンソール

bq

API

Go

Java

Node.js

PHP

Python

クエリの費用を見積もる

オンデマンド クエリのサイズの計算

テーブルデータを探索するためにクエリを実行しない

クエリあたりの課金対象バイト数を制限する

コンソール

bq

API

クラスタ化されていないテーブルでは LIMIT を使用しない

クエリ結果を段階的に実体化する

ワークロードの費用を管理する

Google Cloud 料金計算ツールを使用する。

オンデマンド

エディション

予約とコミットメントを使用する

スロット見積もりツールを使用する

不要な長時間実行ジョブをキャンセルする

ダッシュボードを使用して費用を表示する

課金の予算とアラートを使用する

ストレージ費用を管理する

長期ストレージを使用する

ストレージの課金モデルを構成する

テーブルの上書きを避ける

タイムトラベル期間を短縮する

宛先テーブルにテーブルの有効期限を使用する

Cloud Storage にデータをアーカイブする

次のステップ

オンデマンドクエリのサイズの計算

クラスタ化されていないテーブルでは `LIMIT` を使用しない