費用の見積もりと管理
このページでは、費用を見積もる方法と、BigQuery で費用を管理するためのベスト プラクティスについて説明します。BigQuery には、オンデマンドと容量ベースの 2 種類の料金モデルがあります。料金については、BigQuery の料金をご覧ください。
BigQuery では、クエリの実行にかかる費用の見積もり、さまざまなクエリで処理されるバイト数の計算、予想使用量に基づく毎月の費用の見積もりを行うことができます。費用を抑えるには、クエリ計算の最適化と BigQuery ストレージのベスト プラクティスにも従う必要があります。費用に固有のベスト プラクティスについては、クエリ費用の管理をご覧ください。
クエリの費用と BigQuery の使用状況をモニタリングするには、BigQuery 監査ログを分析します。
クエリの費用を見積もる
BigQuery ではさまざまな方法で費用を見積もることができます。
- オンデマンド料金モデルでクエリを実行する前に、クエリのドライラン オプションを使用して費用を見積もる。
- さまざまなタイプのクエリで処理されるバイト数を計算する。
- Google Cloud 料金計算ツールを使用して、予想使用量に基づく月額料金を確認する。
オンデマンド クエリのサイズの計算
オンデマンド課金モデルを使用して、さまざまなタイプのクエリで処理されるバイト数を計算するには、以降のセクションをご覧ください。
Cloud Storage でのカラム型のクエリ
外部データが ORC または Parquet に保存されている場合、請求対象のバイト数は、BigQuery が読み取る列に限定されます。外部データソースからのデータ型がクエリによって BigQuery のデータ型に変換されるので、読み取られたバイト数は BigQuery のデータ型のサイズに基づいて計算されます。データ型の変換の詳細については、次のページをご覧ください。
Google Cloud 料金計算ツールを使用する
Google Cloud 料金計算ツールを使用すると、予想使用量に基づいて BigQuery の 1 か月の費用の見積もりを作成できます。
オンデマンド
オンデマンド料金モデルを使用している場合に Google Cloud 料金計算ツールで費用を見積もる手順は、次のとおりです。
- Google Cloud 料金計算ツールを開きます。
- [BigQuery] をクリックします。
- [ON-DEMAND] タブをクリックします。
- [Storage Pricing] のストレージのフィールドにテーブルの推定サイズを入力します。データセット ストレージの課金モデルに応じて、物理ストレージまたは論理ストレージのいずれかを推定する必要があります。
- [Query Pricing] に、ドライランまたはクエリ検証ツールから返された推定読み取りバイト数を入力します。
- [Add To Estimate] をクリックします。
- 見積もりが右側に表示されます。見積もりの保存やメールの送信を行うことができます。
詳しくは、オンデマンド料金をご覧ください。
エディション
BigQuery エディションで容量ベースの料金モデルを使用している場合に、Google Cloud 料金計算ツールで費用を見積もる手順は次のとおりです。
- Google Cloud 料金計算ツールを開きます。
- [BigQuery] をクリックします。
- [EDITIONS] タブをクリックします。
- スロットを使用するロケーションを選択します。
- ご使用のエディションを選択します。
- [Maximum slots]、[Baseline slots]、[Commitment]、[Estimated utilization of autoscaling] で該当する値を選択します。
- データを保存するロケーションを選択します。
- アクティブ ストレージ、長期ストレージ、ストリーミング挿入、ストリーミング読み取りの推定ストレージ使用量を入力します。データセット ストレージの課金モデルに応じて、物理ストレージまたは論理ストレージのいずれかを推定する必要があります。
- [Add To Estimate] をクリックします。
詳細については、容量ベースの料金をご覧ください。
クエリ費用を管理する
クエリ費用を最適化するには、ストレージを最適化し、またクエリ計算を最適化します。クエリの費用を管理するその他の方法については、以降のセクションをご覧ください。
クエリを実行する前にクエリ費用を確認する
おすすめの方法: クエリを実行する前に、プレビューして費用を見積もります。
クエリは、読み取られたバイト数に基づいて課金されます。クエリを実行する前に費用を見積もるには:
- Google Cloud コンソールでクエリ検証ツールを使用します。
- Google Cloud 料金計算ツールを使用します。
- クエリのドライランを実行します。
クエリ検証ツールを使用する
Google Cloud コンソールでクエリを入力すると、クエリ検証ツールがクエリ構文を検証し、読み取りバイト数を見積もります。この見積もりを使用して、料金計算ツールでクエリ費用を計算できます。
クエリが無効な場合は、クエリ検証ツールにエラー メッセージが表示されます。例:
Not found: Table myProject:myDataset.myTable was not found in location US
クエリが有効な場合は、クエリ検証ツールによりクエリ処理に必要なバイト数の見積もりが提供されます。例:
This query will process 623.1 KiB when run.
ドライランの実行
ドライランを実行するには、次の操作を行います。
コンソール
BigQuery ページに移動します。
クエリエディタにクエリを入力します。
クエリが有効な場合、クエリで処理されるデータの量とともにチェックマークが自動的に表示されます。クエリが無効な場合は、感嘆符がエラー メッセージとともに表示されます。
bq
--dry_run
フラグを使用して次のようなクエリを入力します。
bq query \ --use_legacy_sql=false \ --dry_run \ 'SELECT COUNTRY, AIRPORT, IATA FROM `project_id`.dataset.airports LIMIT 1000'
有効なクエリの場合、このコマンドによって次のレスポンスが生成されます。
Query successfully validated. Assuming the tables are not modified, running this query will process 10918 bytes of data.
API
API を使用してドライランを実行するには、JobConfiguration タイプで dryRun
を true
に設定してクエリジョブを送信します。
Go
このサンプルを試す前に、クライアント ライブラリを使用した BigQuery クイックスタートにある Go の設定手順を完了してください。詳細については、BigQuery Go API のリファレンス ドキュメントをご覧ください。
BigQuery に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、クライアント ライブラリの認証を設定するをご覧ください。
Java
このサンプルを試す前に、クライアント ライブラリを使用した BigQuery クイックスタートにある Java の設定手順を完了してください。詳細については、BigQuery Java API のリファレンス ドキュメントをご覧ください。
BigQuery に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、クライアント ライブラリの認証を設定するをご覧ください。
Node.js
このサンプルを試す前に、クライアント ライブラリを使用した BigQuery クイックスタートにある Node.js の設定手順を完了してください。詳細については、BigQuery Node.js API のリファレンス ドキュメントをご覧ください。
BigQuery に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、クライアント ライブラリの認証を設定するをご覧ください。
PHP
このサンプルを試す前に、クライアント ライブラリを使用した BigQuery クイックスタートにある PHP の設定手順を完了してください。詳細については、BigQuery PHP API のリファレンス ドキュメントをご覧ください。
BigQuery に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、クライアント ライブラリの認証を設定するをご覧ください。
Python
QueryJobConfig.dry_run プロパティを True
に設定します。ドライランのクエリ構成が渡されると、Client.query() は常に完了した QueryJob を返します。
このサンプルを試す前に、クライアント ライブラリを使用した BigQuery クイックスタートにある Python の設定手順を完了してください。詳細については、BigQuery Python API のリファレンス ドキュメントをご覧ください。
BigQuery に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、クライアント ライブラリの認証を設定するをご覧ください。
テーブルデータを探索するためにクエリを実行しない
おすすめの方法: テーブルデータを探索またはプレビューするためにクエリを実行しないでください。
データを試したり調べたりする場合は、テーブル プレビュー オプションを使用すれば、割り当てに影響を与えることなく、無料でデータを表示できます。
BigQuery は、次のデータ プレビュー オプションをサポートしています。
- Google Cloud コンソールのテーブルの詳細ページで、[プレビュー] タブをクリックしてデータをサンプリングする。
- bq コマンドライン ツールで
bq head
コマンドを使用して、プレビューする行数を指定する。 - API で
tabledata.list
を使用して、指定した行のセットからテーブルデータを取得する。 - クラスタ化されていないテーブルでは
LIMIT
を使用しない。クラスタ化されていないテーブルの場合は、LIMIT
句によってコンピューティング費用が削減されません。
課金されるバイト数を制限する
おすすめの方法: 課金される最大バイト数の設定を使用して、クエリ費用を抑えます。
課金されるクエリのバイト数を制限するには、課金される最大バイト数の設定を使用します。この設定を行うと、クエリが実行される前に、クエリで読み取られるバイト数が推定されます。推定バイト数が上限を超えると、クエリが失敗し、料金は発生しません。
クラスタ化テーブルの場合、クエリに対して課金されるバイト数の推定値は上限値になります。クエリ実行後に請求される実際のバイト数より高くなることがあります。そのため、課金対象の最大バイト数を設定すると、課金される実際のバイト数が課金対象の最大バイト数を超えなくても、クラスタ化テーブルに対するクエリが失敗する場合があります。
課金される最大バイト数を設定したことによってクエリが失敗した場合は、次のようなエラーが返されます。
Error: Query exceeded limit for bytes billed: 1000000. 10485760 or higher
required.
課金される最大バイト数を設定するには:
コンソール
- クエリエディタで、[展開] > [クエリ設定] > [詳細オプション] の順にクリックします。
- [課金される最大バイト数] フィールドに整数を入力します。
- [保存] をクリックします。
bq
bq query
コマンドを使用し、--maximum_bytes_billed
フラグを指定します。
bq query --maximum_bytes_billed=1000000 \ --use_legacy_sql=false \ 'SELECT word FROM `bigquery-public-data`.samples.shakespeare'
API
JobConfigurationQuery
または QueryRequest
で maximumBytesBilled
プロパティを設定します。
クラスタ化されていないテーブルでは LIMIT
を使用しない
おすすめの方法: クラスタ化されていないテーブルでは、費用を管理する手法として LIMIT
句を使用しないでください。
クラスタ化されていないテーブルの場合、LIMIT
句をクエリに適用しても、読み取られるデータの量には影響しません。クエリがサブセットのみを返す場合でも、クエリで示されているテーブル全体のすべてのバイトの読み取りに対して課金されます。クラスタ化テーブルでは、結果を取得するために十分なブロックがスキャンされるとスキャンが停止するため、LIMIT
句でスキャンできるバイト数を減らすことができます。スキャンされたバイトに対してのみ課金されます。
ダッシュボードを使用して費用を表示し、監査ログを照会する
おすすめの方法: BigQuery の使用量を調整できるように、課金データを表示するためのダッシュボードを作成します。また、使用パターンを分析できるように、BigQuery への監査ログのストリーミングも検討します。
課金データを BigQuery にエクスポートして、Looker Studio などのツールで可視化できます。課金ダッシュボードの作成方法のチュートリアルについては、BigQuery と Looker Studio を使用した Google Cloud Billing の可視化をご覧ください。
また、監査ログを BigQuery にストリーミングして、ユーザー別のクエリ費用などの使用パターンに関するログを分析することもできます。
クエリ結果を段階的に実体化する
おすすめの方法: 可能であれば、クエリ結果を段階的に実体化します。
大容量のマルチステージ クエリを作成すると、それを実行するたびに、BigQuery がそのクエリに必要なすべてのデータを読み取ります。クエリが実行されるたびに読み取られるすべてのデータに対して課金されます。
代わりに、クエリを複数のステージに分割し、各ステージでクエリ結果を宛先テーブルに書き込むことにより実体化します。小容量の宛先テーブルを照会することにより、読み取られるデータの量が削減され、費用が削減されます。実体化された結果を保存する費用は、大量のデータを処理する費用よりはるかに少なくなります。
宛先テーブルにテーブルの有効期限を使用する
おすすめの方法: 大容量のクエリ結果を宛先テーブルに書き込む場合は、デフォルトのテーブル有効期限を適用して不要になったデータを削除します。
BigQuery ストレージでラージ アウトプット セットを維持するには費用がかかります。結果に永続的にアクセスする必要がなければ、デフォルトのテーブル有効期限を使用して自動的にデータを削除するようにします。
詳細については、ストレージの料金をご覧ください。
次のステップ
- BigQuery の料金を確認する。
- クエリを最適化する方法を確認する。
- ストレージを最適化する方法を確認する。
課金、アラート、データの可視化について詳しくは、次のトピックをご覧ください。