このドキュメントでは、Cloud Data Fusion の料金について説明します。他のプロダクトの料金を確認するには、料金のドキュメントをご覧ください。
料金算定の目的で、使用時間を、Cloud Data Fusion インスタンスが作成されてから削除されるまでの時間(分単位)として測定します。料金は時間単位ですが、Cloud Data Fusion では分単位で課金されます。分単位での使用に対して時間単位の料金を適用するため、使用時間は時間単位で測定されます(たとえば、30 分は 0.5 時間)。
米ドル以外の通貨でお支払いの場合は、Google Cloud SKU に記載されている当該通貨の料金が適用されます。
Cloud Data Fusion の料金は、パイプラインの開発と実行という 2 つの機能に分けられます。
開発環境
パイプラインの開発に関し、Cloud Data Fusion には次の 3 つのエディションがあります。
Cloud Data Fusion エディション | 料金(米ドル) |
|---|---|
デベロッパー | $0.35 / 1 hour |
基本 | 0 hour to 120 hour Free per 1 month / account 120 hour and above $1.80 / 1 hour, per 1 month / account |
Enterprise | $4.20 / 1 hour |
Basic エディションでは、アカウントごとに毎月最初の 120 時間が無料です。
実行
パイプラインの実行については、Cloud Data Fusion がパイプラインを実行するために作成する Managed Service for Apache Spark クラスタに対して現在の Managed Service for Apache Spark の料金で課金されます。
Capability | デベロッパー | 基本 | Enterprise |
|---|---|---|---|
同時ユーザー数 | 2 | 制限付き* | 制限付き* |
ワークロード | 開発、プロダクトの調査 | テスト、サンドボックス、概念実証 | 本番環境 |
内部 IP のサポート | ✓ | ✓ | ✓ |
ロールベース アクセス制御(RBAC) | 🚫 | 🚫 | ✓ |
ビジュアル デザイナー | ✓ | ✓ | ✓ |
コネクタ エコシステム | ✓ | ✓ | ✓ |
ビジュアル変換 | ✓ | ✓ | ✓ |
構造化、非構造化、半構造化 | ✓ | ✓ | ✓ |
ストリーミング パイプライン | ✓ | ✓ | ✓ |
統合リネージ - フィールドとデータセット レベル | ✓ | ✓ | ✓ |
Knowledge Catalog との統合 | ✓ | ✓ | ✓ |
高可用性 | ゾーン | リージョン | リージョン |
コンピューティング プロファイルの作成とカスタマイズ | ✓ | ✓ | ✓ |
DevOps サポート: REST API、ソース コントロール管理 | ✓ | ✓ | ✓ |
トリガーとスケジュール | ✓ | ✓ | ✓ |
実行環境の選択 | ✓ | ✓ | ✓ |
パイプラインの同時実行 | 🚫 | 制限付き** | 制限付き** |
開発者 SDK(機能拡張) | ✓ | ✓ | ✓ |
* 同時ユーザー数: 一般的に、Cloud Data Fusion でサポートされるのは、インスタンスあたり最大 50 ユーザーです。RBAC が有効な場合は、最大 25 ユーザーです。
** パイプラインの同時実行は、使用しているインスタンス バージョンによって制限されます。スケーラビリティの詳細については、Google Cloud の担当者にお問い合わせください。
Cloud Data Fusion インスタンスの開発費用に加えて、たとえば以下に示すような、パイプラインの実行に使用するリソースのみが請求の対象となります。
★ レプリケーション ジョブの構築には、オンデマンド価格ではなく、BigQuery の定額料金 を推奨します。
現在のところ、Cloud Data Fusion の料金はサポートされているすべてのリージョンで同一です。
地域 | 場所 |
|---|---|
africa-south1 * | ヨハネスブルグ(南アフリカ) |
asia-east1 | 彰化県(台湾) |
asia-east2 | 香港 |
asia-northeast1 | 東京(日本) |
asia-northeast2 | 大阪(日本) |
asia-northeast3 | ソウル(韓国) |
asia-south1 | ムンバイ(インド) |
asia-south2 | デリー(インド) |
asia-southeast1 | ジュロンウェスト(シンガポール) |
asia-southeast2 | ジャカルタ(インドネシア) |
australia-southeast1 | シドニー(オーストラリア) |
europe-north1 | ハミナ(フィンランド) |
europe-southwest1 | マドリード(スペイン) |
europe-west1 | サンギスラン(ベルギー) |
europe-west2 | ロンドン(イギリス) |
europe-west3 | フランクフルト(ドイツ) |
europe-west4 | エームスハーヴェン(オランダ) |
europe-west6 | チューリッヒ(スイス) |
europe-west8 | ミラノ(イタリア) |
europe-west9 | パリ(フランス) |
europe-west12* | トリノ(イタリア) |
me-central1* | ドーハ(カタール) |
me-central2* | ダンマーム(サウジアラビア) |
me-west1 | テルアビブ(イスラエル) |
northamerica-northeast1 | ケベック州モントリオール(カナダ) |
northamerica-south1 | メキシコ |
southamerica-east1 | サンパウロ州オザスコ(ブラジル) |
southamerica-west1 | サンティアゴ(チリ) |
us-central1 | アイオワ州カウンシル ブラフス(北米) |
us-east1 | サウスカロライナ州モンクスコーナー(北米) |
us-east4 | バージニア州北部アッシュバーン(北米) |
us-east5 | オハイオ州コロンバス(北米) |
us-south1 | テキサス州ダラス(北米) |
us-west1 | オレゴン州ダラス(北米) |
us-west2 | カリフォルニア州ロサンゼルス(北米) |
* Cloud Data Fusion のデータリネージは、africa-south1、me-central1、me-central1、europe-west12 ではサポートされていません。
Cloud Data Fusion インスタンスが 24 時間実行されていて、Basic エディションには無料の時間が残っていないとします。エディションに基づいて、Cloud Data Fusion でのインスタンス費用を次の表に示します。
Edition | 1 時間あたりの費用 | 時間数 | 開発費用がかかる |
|---|---|---|---|
デベロッパー | $0.35 | 24 | 24*0.35 = $8.4 |
基本 | $1.80 | 24 | 24*1.8 = $43.2 |
Enterprise | $4.20 | 24 | 24*4.2 = $100.8 |
★ 注: Cloud Data Fusion インスタンスは、プロビジョニングされると、常に利用可能である必要があります。インスタンスを削除すると、復元できず、パイプライン データはすべて失われます。月額費用の見積もりについては、料金の概要をご覧ください。
この 24 時間の間に、Cloud Storage から生データを読み取り、変換を実施し、そのデータを 1 時間ごとに BigQuery に書き込むパイプラインを実行しました。それぞれが完了するまでに約 15 分かかりました。つまり、これらの実行用に作成した Managed Service for Apache Spark クラスタは、それぞれ 15 分間(0.25 時間)稼働していました。各 Managed Service for Apache Spark クラスタの構成は次のようになっているとします。
項目 | マシンタイプ | 仮想 CPU 数 | 接続されている永続ディスク | クラスタ内の数 |
|---|---|---|---|---|
マスターノード | n1-standard-4 | 4 | 500 GB | 1 |
ワーカーノード | n1-standard-4 | 4 | 500 GB | 5 |
Managed Service for Apache Spark クラスタには、それぞれ仮想 CPU が 24 個あります(マスター用に 4 個、20 個はワーカーに分散)。Managed Service for Apache Spark の課金では、このクラスタのサイズ(24 個の仮想 CPU)とそれぞれの実行時間に基づいて料金を求めます。
パイプラインの実行全体で Managed Service for Apache Spark にかかる合計料金は、次のように計算できます。
Managed Service for Apache Spark の料金 = vCPU 数 * クラスタ数 * クラスタあたりの時間数 * Managed Service for Apache Spark の料金
= 24 * 24 * 0.25 * $0.01
= $1.44
Managed Service for Apache Spark クラスタは他の Google Cloud プロダクトを使用します。これは別途課金されます。具体的には、これらのクラスタでは Compute Engine と標準 Persistent Disk 設定容量について課金されます。パイプラインが処理するデータ量に応じて、Cloud Storage と BigQuery のストレージ料金が発生します。
料金計算ツールを使用することで、現在の料金に基づいてこれらの追加費用を求められます。