BigQuery のおすすめの方法: ストレージの最適化

このページでは、BigQuery ストレージを最適化するためのおすすめの方法について説明します。

有効期限の設定を使用して不要なテーブルとパーティションを削除する

ベスト プラクティス: データセットにデフォルトのテーブル有効期限を構成し、テーブルに有効期限を構成します。また、時間分割テーブルにパーティションの有効期限を構成します。

データセット内に新しく作成されたテーブルのデフォルトのテーブル有効期限を設定することによって、ストレージ費用を制御でき、ストレージ使用量を最適化できます。データセットの作成時にこのプロパティを設定すると、そのデータセット内に作成されたすべてのテーブルは有効期限を過ぎると削除されます。データセットの作成後にこのプロパティを設定すると、その後に作成した新しいテーブルのみが、有効期限を過ぎると削除されます。

たとえば、デフォルトのテーブル有効期限を 7 日に設定すると、古いデータは 1 週間後に自動的に削除されます。

このオプションは、最新のデータにのみアクセスする必要がある場合に便利です。データの実験を行っていて、そのデータを保持する必要がない場合にも便利です。

テーブルが日付で分割されている場合は、データセットのデフォルトのテーブル有効期限が個々のパーティションに適用されます。また、CLI の time_partitioning_expiration フラグまたは API の expirationMs 構成設定を使用して、パーティションの有効期限を制御することもできます。たとえば、次のコマンドでは、パーティションは 3 日後に期限切れになります。

bq mk --time_partitioning_type=DAY --time_partitioning_expiration=259200 [DATASET].[TABLE]

長期保存を活用する

おすすめの方法: データを BigQuery に保持します。

データは無料で BigQuery に読み込むことができます。古いデータを別のストレージ オプション(Google Cloud Storage など)にエクスポートするのではなく、BigQuery の長期保存の料金を活用します。

テーブルが 90 日間連続で編集されていない場合、そのテーブルのストレージの料金は、毎月 GB あたり $0.01 を限度として自動的に 50% 割り引かれます。これは Cloud Storage Nearline と同じ費用です。

分割テーブルの各パーティションには長期保存の料金が個別に適用されます。90 日間変更されなかったパーティションのデータは長期保存の料金の対象となり、割引価格で課金されます。

料金計算ツールを使用してストレージ費用を見積もる

おすすめの方法: Google Cloud Platform 料金計算ツールを使用してストレージ費用を見積もります。

Google Cloud Platform 料金計算ツールでストレージ費用を見積もるには、保存されているバイト数を MB、GB、TB、PB のいずれかの単位で入力します。BigQuery では月あたり 10 GB のストレージが無料で提供されます。

料金計算ツール

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...