Vertex AI の料金

Vertex AI の料金は、Vertex AI がオーバーライドした既存のプロダクトと同じです。たとえば、Vertex AI と AutoML Vision のどちらでトレーニングしても、AutoML 画像分類モデルのトレーニングの費用は同じです。

料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

Vertex AI と従来の AI Platform の料金の比較

Vertex AI オペレーションと同等の「レガシー」オペレーションの料金は、オペレーションごとに変わりません。たとえば、AI Platform Training を使用してモデルをトレーニングする場合は、Vertex AI Training を使用してモデルをトレーニングするのと同じ料金になります。

以前の AI Platform プロダクトを使用している場合、課金は「トレーニング ユニット」数で表すことができます。

Vertex AutoML モデル

Vertex AutoML モデルでは、次の 3 つの主なアクティビティに対して課金されます。

  • モデルのトレーニング
  • エンドポイントへのモデルのデプロイ
  • モデルを使用した予測

Vertex AI は、Vertex AutoML モデルに事前定義されたマシン構成を使用し、これらのアクティビティの 1 時間あたりの料金はリソース使用量に反映されます。

モデルのトレーニングに必要な時間は、トレーニング対象データのサイズや複雑さによって異なります。オンライン予測またはオンラインでの説明を行うには、まずモデルをデプロイする必要があります。

料金情報については、以下のモデルタイプを選択してください。

画像データ

オペレーション ノード時間あたりの料金(分類) ノード時間あたりの料金(オブジェクト検出)
トレーニング $3.465 $3.465
トレーニング(デバイス内) $18.00 $18.00
デプロイとオンライン予測 $1.375 $2.002
バッチ予測 $2.222 $2.222

動画データ

オペレーション ノード時間あたりの料金
トレーニング $3.234
予測 $0.462

表形式データ

オペレーション 分類/回帰のノード時間あたりの料金 予測の料金
トレーニング $21.252 $21.252
予測 カスタム トレーニング モデルの予測と同じ料金 予測 1,000 回あたり $1.00(バッチのみ)
以前のデプロイメント $0.004055 なし
オンライン予測とオンライン説明 $0.231 なし
レガシー バッチ予測 $1.276 なし

テキストデータ

オペレーション 料金
レガシーデータのアップロード(PDF のみ)

毎月最初の 1,000 ページは無料

1,000 ページあたり $1.5

5,000,000 を超える場合は、1,000 ページあたり $0.60

トレーニング $3.30/時間
導入 $0.05/時間
予測 $5.00/テキスト レコード 1,000 件

Vertex AutoML テキスト予測リクエストの料金は、分析のために送信したテキスト レコードの数に基づいて計算されます。テキスト レコードとは、1,000 文字までの Unicode 文字(空白文字や、HTML / XML タグなどのマークアップ文字も含む)からなる書式なしテキストです。

予測リクエストに指定されたテキストが 1,000 文字を超える場合、1,000 文字ごとに 1 件のテキスト レコードとしてカウントされます。たとえば、それぞれ 800、1,500、600 文字を含む 3 つのリクエストを送信する場合、最初のリクエスト(800)が 1 件、2 番目のリクエスト(1,500)が 2 件、3 番目のリクエスト(600)が 1 件で合計 4 件のテキスト レコードとして課金されます。

カスタムトレーニングされたモデル

トレーニング

以下の各表は、さまざまなトレーニング構成のおおよその時間あたりの料金を示しています。特定のマシンタイプからなるカスタム構成を選択できます。料金を計算するには、使用する仮想マシンの費用を合算します。

Compute Engine マシンタイプにアクセラレータを接続する場合、アクセラレータの費用は含まれません。費用を計算するには、以下のアクセラレータの表に示す料金に、使用する各タイプのアクセラレータのマシン時間を掛けます。

以下の各表は、カスタム トレーニングを利用可能なリージョンごとの料金をまとめたものです。

南北アメリカ

マシンタイプ - 1 時間あたりの料金
n1-standard-4 $0.2185
n1-standard-8 $0.4370
n1-standard-16 $0.8740
n1-standard-32 $1.7480
n1-standard-64 $3.4960
n1-standard-96 $5.2440
n1-highmem-2 $0.1362
n1-highmem-4 $0.2723
n1-highmem-8 $0.5446
n1-highmem-16 $1.0893
n1-highmem-32 $2.1786
n1-highmem-64 $4.3571
n1-highmem-96 $6.5357
n1-highcpu-16 $0.6523
n1-highcpu-32 $1.3046
n1-highcpu-64 $2.6091
n1-highcpu-96 $3.9123
a2-highgpu-1g $0.8504
a2-highgpu-2g $1.7009
a2-highgpu-4g $3.4016
a2-highgpu-8g $6.8032
a2-megagpu-16g $10.1166
e2-standard-4 $0.1495
e2-standard-8 $0.3105
e2-standard-16 $0.6210
e2-standard-32 $1.2305
e2-highmem-2 $0.1035
e2-highmem-4 $0.2070
e2-highmem-8 $0.4140
e2-highmem-16 $0.8280
e2-highcpu-16 $0.4600
e2-highcpu-32 $0.9085
n2-standard-4 $0.2185
n2-standard-8 $0.4485
n2-standard-16 $0.8970
n2-standard-32 $1.7825
n2-standard-48 $2.6795
n2-standard-64 $3.5765
n2-standard-80 $4.4620
n2-highmem-2 $0.1495
n2-highmem-4 $0.2990
n2-highmem-8 $0.5980
n2-highmem-16 $1.2075
n2-highmem-32 $2.4150
n2-highmem-48 $3.6110
n2-highmem-64 $4.8185
n2-highmem-80 $6.0260
n2-highcpu-16 $0.6555
n2-highcpu-32 $1.3225
n2-highcpu-48 $1.9780
n2-highcpu-64 $2.6335
n2-highcpu-80 $3.3005
c2-standard-4 $0.2415
c2-standard-8 $0.4830
c2-standard-16 $0.9545
c2-standard-30 $1.8055
c2-standard-60 $3.5995
アクセラレータ - 1 時間あたりの料金
NVIDIA_TESLA_A100 $3.5650
NVIDIA_TESLA_K80 $0.5175
NVIDIA_TESLA_P4 $0.6900
NVIDIA_TESLA_P100 $1.6790
NVIDIA_TESLA_T4 $0.4025
NVIDIA_TESLA_V100 $2.8520
ディスク - 1 時間あたりの GB あたりの料金
pd-standard $0.0000767
pd-ssd $0.0002833

ヨーロッパ

マシンタイプ - 1 時間あたりの料金
n1-standard-4 $0.2530
n1-standard-8 $0.5060
n1-standard-16 $1.0120
n1-standard-32 $2.0240
n1-standard-64 $4.0480
n1-standard-96 $6.0720
n1-highmem-2 $0.1576
n1-highmem-4 $0.3151
n1-highmem-8 $0.6302
n1-highmem-16 $1.2604
n1-highmem-32 $2.5208
n1-highmem-64 $5.0416
n1-highmem-96 $7.5624
n1-highcpu-16 $0.7553
n1-highcpu-32 $1.5106
n1-highcpu-64 $3.0213
n1-highcpu-96 $4.5319
a2-highgpu-1g $0.9362
a2-highgpu-2g $1.8724
a2-highgpu-4g $3.7447
a2-highgpu-8g $7.4894
a2-megagpu-16g $11.1366
e2-standard-4 $0.1955
e2-standard-8 $0.3795
e2-standard-16 $0.7590
e2-standard-32 $1.5180
e2-highmem-2 $0.1265
e2-highmem-4 $0.2530
e2-highmem-8 $0.5175
e2-highmem-16 $1.0235
e2-highcpu-16 $0.5635
e2-highcpu-32 $1.1270
n2-standard-4 $0.2760
n2-standard-8 $0.5520
n2-standard-16 $1.1040
n2-standard-32 $2.2080
n2-standard-48 $3.3120
n2-standard-64 $4.4045
n2-standard-80 $5.5085
n2-highmem-2 $0.1840
n2-highmem-4 $0.3680
n2-highmem-8 $0.7475
n2-highmem-16 $1.4835
n2-highmem-32 $2.9785
n2-highmem-48 $4.4620
n2-highmem-64 $5.9455
n2-highmem-80 $7.4290
n2-highcpu-16 $0.8165
n2-highcpu-32 $1.6330
n2-highcpu-48 $2.4380
n2-highcpu-64 $3.2545
n2-highcpu-80 $4.0710
c2-standard-4 $0.2990
c2-standard-8 $0.5980
c2-standard-16 $1.1845
c2-standard-30 $2.2195
c2-standard-60 $4.4390
アクセラレータ - 1 時間あたりの料金
NVIDIA_TESLA_A100 $3.5650
NVIDIA_TESLA_K80 $0.5635
NVIDIA_TESLA_P4 $0.7475
NVIDIA_TESLA_P100 $1.8400
NVIDIA_TESLA_T4 $0.4370
NVIDIA_TESLA_V100 $2.9325
ディスク - 1 時間あたりの GB あたりの料金
pd-standard $0.0000722
pd-ssd $0.0003194

アジア太平洋

マシンタイプ - 1 時間あたりの料金
n1-standard-4 $0.2530
n1-standard-8 $0.5060
n1-standard-16 $1.0120
n1-standard-32 $2.0240
n1-standard-64 $4.0480
n1-standard-96 $6.0720
n1-highmem-2 $0.1576
n1-highmem-4 $0.3151
n1-highmem-8 $0.6302
n1-highmem-16 $1.2604
n1-highmem-32 $2.5208
n1-highmem-64 $5.0416
n1-highmem-96 $7.5624
n1-highcpu-16 $0.7553
n1-highcpu-32 $1.5106
n1-highcpu-64 $3.0213
n1-highcpu-96 $4.5319
a2-highgpu-1g $0.9362
a2-highgpu-2g $1.8724
a2-highgpu-4g $3.7447
a2-highgpu-8g $7.4894
a2-megagpu-16g $11.1366
e2-standard-4 $0.1955
e2-standard-8 $0.3795
e2-standard-16 $0.7590
e2-standard-32 $1.5180
e2-highmem-2 $0.1265
e2-highmem-4 $0.2530
e2-highmem-8 $0.5175
e2-highmem-16 $1.0235
e2-highcpu-16 $0.5635
e2-highcpu-32 $1.1270
n2-standard-4 $0.2760
n2-standard-8 $0.5520
n2-standard-16 $1.1040
n2-standard-32 $2.2080
n2-standard-48 $3.3120
n2-standard-64 $4.4045
n2-standard-80 $5.5085
n2-highmem-2 $0.1840
n2-highmem-4 $0.3680
n2-highmem-8 $0.7475
n2-highmem-16 $1.4835
n2-highmem-32 $2.9785
n2-highmem-48 $4.4620
n2-highmem-64 $5.9455
n2-highmem-80 $7.4290
n2-highcpu-16 $0.8165
n2-highcpu-32 $1.6330
n2-highcpu-48 $2.4380
n2-highcpu-64 $3.2545
n2-highcpu-80 $4.0710
c2-standard-4 $0.2990
c2-standard-8 $0.5980
c2-standard-16 $1.1845
c2-standard-30 $2.2195
c2-standard-60 $4.4390
アクセラレータ - 1 時間あたりの料金
NVIDIA_TESLA_A100 $3.5650
NVIDIA_TESLA_K80 $0.5635
NVIDIA_TESLA_P4 $0.7475
NVIDIA_TESLA_P100 $1.8400
NVIDIA_TESLA_T4 $0.4485
NVIDIA_TESLA_V100 $2.9325
ディスク - 1 時間あたりの GB あたりの料金
pd-standard $0.0000722
pd-ssd $0.0003194
  • すべてのご利用は Vertex AI の割り当てポリシーの対象となります。
  • Vertex AI のライフサイクル中は、データやプログラム ファイルを Google Cloud Storage のバケットに保存する必要があります。 詳しくは、Cloud Storage の使用方法をご覧ください。

モデルのトレーニングには料金が発生します。

  • 1 分単位で課金。
  • 1 トレーニング ジョブの最短時間は 10 分。
  • ジョブにリソースがプロビジョニングされたときからジョブが完了するまで。

事前定義された構成のスケール階層(AI Platform Training)

お客様は、モデルをトレーニングする際に使用する処理クラスタのタイプを調整できます。最も簡単な方法は、「スケール階層」という事前に定義された構成の中から 1 つを選択することです。 詳細については、スケール階層をご覧ください。

カスタム構成用のマシンタイプ

Vertex AI を使用する場合、または AI Platform Training のスケール階層として CUSTOM を選択した場合は、クラスタのマスター、ワーカー、パラメータ サーバーに使用する仮想マシンの数とタイプを調整できます。詳しくは、Vertex AI のマシンタイプAI Platform Training のマシンタイプをご覧ください。

カスタム処理クラスタを使用したトレーニングの料金は、指定した全マシンの合計になります。個々のマシンのアクティブな処理時間ではなく、ジョブの合計時間に対して課金されます。

予測と説明

この表は、バッチ予測、オンライン予測、およびオンライン説明のノード時間あたりの料金を示しています。ノード時間は、仮想マシンが予測ジョブの実行に費やした時間、または準備状態で予測リクエストまたは説明リクエストの処理の待機に費やした時間を表します。

アメリカ大陸

予測
予測と説明
マシンタイプ - ノード時間あたりの料金
n1-standard-2 概算値:
us-east4 $0.123
northamerica-northeast1 $0.1203
南北アメリカのその他のリージョン $0.1093
n1-standard-4 概算値:
us-east4 $0.2461
northamerica-northeast1 $0.2405
南北アメリカのその他のリージョン $0.2186
n1-standard-8 概算値:
us-east4 $0.4922
northamerica-northeast1 $0.4811
南北アメリカのその他のリージョン $0.4372
n1-standard-16 概算値:
us-east4 $0.9843
northamerica-northeast1 $0.9622
南北アメリカのその他のリージョン $0.8744
n1-standard-32 概算値:
us-east4 $1.9687
northamerica-northeast1 $1.9243
南北アメリカのその他のリージョン $1.7488
n1-highmem-2 概算値:
us-east4 $0.1532
northamerica-northeast1 $0.1498
南北アメリカのその他のリージョン $0.1361
n1-highmem-4 概算値:
us-east4 $0.3064
northamerica-northeast1 $0.2995
南北アメリカのその他のリージョン $0.2723
n1-highmem-8 概算値:
us-east4 $0.6129
northamerica-northeast1 $0.5991
南北アメリカのその他のリージョン $0.5445
n1-highmem-16 概算値:
us-east4 $1.2257
northamerica-northeast1 $1.1982
南北アメリカのその他のリージョン $1.089
n1-highmem-32 概算値:
us-east4 $2.4515
northamerica-northeast1 $2.3963
南北アメリカのその他のリージョン $2.178
n1-highcpu-2 概算値:
us-east4 $0.0918
northamerica-northeast1 $0.0897
南北アメリカのその他のリージョン $0.0815
n1-highcpu-4 概算値:
us-east4 $0.1835
northamerica-northeast1 $0.1794
南北アメリカのその他のリージョン $0.163
n1-highcpu-8 概算値:
us-east4 $0.3671
northamerica-northeast1 $0.3588
南北アメリカのその他のリージョン $0.326
n1-highcpu-16 概算値:
us-east4 $0.7341
northamerica-northeast1 $0.7176
南北アメリカのその他のリージョン $0.6519
n1-highcpu-32 概算値:
us-east4 $1.4683
northamerica-northeast1 $1.4352
南北アメリカのその他のリージョン $1.3039

ヨーロッパ

予測
予測と説明
マシンタイプ - ノード時間あたりの料金
n1-standard-2 概算値:
europe-west2 $0.1408
ヨーロッパのその他のリージョン $0.1265
n1-standard-4 概算値:
europe-west2 $0.2815
ヨーロッパのその他のリージョン $0.2531
n1-standard-8 概算値:
europe-west2 $0.563
ヨーロッパのその他のリージョン $0.5061
n1-standard-16 概算値:
europe-west2 $1.126
ヨーロッパのその他のリージョン $1.0123
n1-standard-32 概算値:
europe-west2 $2.2521
ヨーロッパのその他のリージョン $2.0245
n1-highmem-2 概算値:
europe-west2 $0.1753
ヨーロッパのその他のリージョン $0.1575
n1-highmem-4 概算値:
europe-west2 $0.3506
ヨーロッパのその他のリージョン $0.3151
n1-highmem-8 概算値:
europe-west2 $0.7011
ヨーロッパのその他のリージョン $0.6302
n1-highmem-16 概算値:
europe-west2 $1.4022
ヨーロッパのその他のリージョン $1.2603
n1-highmem-32 概算値:
europe-west2 $2.8044
ヨーロッパのその他のリージョン $2.5206
n1-highcpu-2 概算値:
europe-west2 $0.105
ヨーロッパのその他のリージョン $0.0944
n1-highcpu-4 概算値:
europe-west2 $0.21
ヨーロッパのその他のリージョン $0.1888
n1-highcpu-8 概算値:
europe-west2 $0.4199
ヨーロッパのその他のリージョン $0.3776
n1-highcpu-16 概算値:
europe-west2 $0.8398
ヨーロッパのその他のリージョン $0.7552
n1-highcpu-32 概算値:
europe-west2 $1.6796
ヨーロッパのその他のリージョン $1.5104

アジア太平洋

予測
予測と説明
マシンタイプ - ノード時間あたりの料金
n1-standard-2 概算値:
asia-northeast1 $0.1402
asia-southeast1 $0.1348
australia-southeast1 $0.155
アジア太平洋のその他のリージョン $0.1265
n1-standard-4 概算値:
asia-northeast1 $0.2803
asia-southeast1 $0.2695
australia-southeast1 $0.31
アジア太平洋のその他のリージョン $0.2531
n1-standard-8 概算値:
asia-northeast1 $0.5606
asia-southeast1 $0.5391
australia-southeast1 $0.6201
アジア太平洋のその他のリージョン $0.5061
n1-standard-16 概算値:
asia-northeast1 $1.1213
asia-southeast1 $1.0782
australia-southeast1 $1.2401
アジア太平洋のその他のリージョン $1.0123
n1-standard-32 概算値:
asia-northeast1 $2.2426
asia-southeast1 $2.1564
australia-southeast1 $2.4802
アジア太平洋のその他のリージョン $2.0245
n1-highmem-2 概算値:
asia-northeast1 $0.1744
asia-southeast1 $0.1678
australia-southeast1 $0.193
アジア太平洋のその他のリージョン $0.1575
n1-highmem-4 概算値:
asia-northeast1 $0.3489
asia-southeast1 $0.3357
australia-southeast1 $0.3861
アジア太平洋のその他のリージョン $0.3151
n1-highmem-8 概算値:
asia-northeast1 $0.6977
asia-southeast1 $0.6713
australia-southeast1 $0.7721
アジア太平洋のその他のリージョン $0.6302
n1-highmem-16 概算値:
asia-northeast1 $1.3955
asia-southeast1 $1.3426
australia-southeast1 $1.5443
アジア太平洋のその他のリージョン $1.2603
n1-highmem-32 概算値:
asia-northeast1 $2.791
asia-southeast1 $2.6852
australia-southeast1 $3.0885
アジア太平洋のその他のリージョン $2.5206
n1-highcpu-2 概算値:
asia-northeast1 $0.1046
asia-southeast1 $0.1005
australia-southeast1 $0.1156
アジア太平洋のその他のリージョン $0.0944
n1-highcpu-4 概算値:
asia-northeast1 $0.2093
asia-southeast1 $0.201
australia-southeast1 $0.2312
アジア太平洋のその他のリージョン $0.1888
n1-highcpu-8 概算値:
asia-northeast1 $0.4186
asia-southeast1 $0.4021
australia-southeast1 $0.4624
アジア太平洋のその他のリージョン $0.3776
n1-highcpu-16 概算値:
asia-northeast1 $0.8371
asia-southeast1 $0.8041
australia-southeast1 $0.9249
アジア太平洋のその他のリージョン $0.7552
n1-highcpu-32 概算値:
asia-northeast1 $1.6742
asia-southeast1 $1.6082
australia-southeast1 $1.8498
アジア太平洋のその他のリージョン $1.5104

マシンタイプは、Google Cloud の請求書で以下の 2 つの別々の SKU として課金されます。

  • vCPU 費用、vCPU 時間で測定
  • RAM 費用、GB 時間で測定

前の表のマシンタイプの料金は、そのマシンタイプを使用するモデル バージョンの予測ノードごとの合計時間単位費用の概算です。たとえば、n1-highcpu-32 マシンタイプには 32 個の vCPU と 28.8 GB の RAM が搭載されているので、ノードあたりの時間単位料金は 32 vCPU 時間 + 28.8 GB 時間に等しくなります。

前の表の料金は、予測費用を見積もるための参考用として提供されています。次の表は、請求される SKU をより正確に反映した予測マシンタイプの vCPU と RAM の料金を示しています。

南北アメリカ

予測マシンタイプの SKU
vCPU
北バージニア(us-east4 vCPU 時間あたり $0.04094575
モントリオール(northamerica-northeast1 vCPU 時間あたり $0.0400223
南北アメリカのその他のリージョン vCPU 時間あたり $0.03635495
RAM
北バージニア(us-east4 GB 時間あたり $0.00548665
モントリオール(northamerica-northeast1 GB 時間あたり $0.0053636
南北アメリカのその他のリージョン GB 時間あたり $0.0048783

ヨーロッパ

予測マシンタイプの SKU
vCPU
ロンドン(europe-west2 vCPU 時間あたり $0.0468395
ヨーロッパのその他のリージョン vCPU 時間あたり $0.0421268
RAM
ロンドン(europe-west2 GB 時間あたり $0.0062767
ヨーロッパのその他のリージョン GB 時間あたり $0.0056373

アジア太平洋

予測マシンタイプの SKU
vCPU
東京(asia-northeast1 vCPU 時間あたり $0.0467107
シンガポール(asia-southeast1 vCPU 時間あたり $0.04484885
シドニー(australia-southeast1 vCPU 時間あたり $0.0515844
アジア太平洋のその他のリージョン vCPU 時間あたり $0.0421268
RAM
東京(asia-northeast1 GB 時間あたり $0.00623185
シンガポール(asia-southeast1 GB 時間あたり $0.0060099
シドニー(australia-southeast1 GB 時間あたり $0.00691265
アジア太平洋のその他のリージョン GB 時間あたり $0.0056373

オプションで、予測用の GPU アクセラレータを使用できます。GPU には、前の表で説明したものとは別の追加料金がかかります。次の表に、GPU のタイプ別の料金を示します。

南北アメリカ

アクセラレータ - 1 時間あたりの料金
NVIDIA_TESLA_K80
アイオワ(us-central1 $0.5175
サウスカロライナ(us-east1 $0.5175
NVIDIA_TESLA_P4
アイオワ(us-central1 $0.6900
北バージニア(us-east4 $0.6900
モントリオール(northamerica-northeast1 $0.7475
NVIDIA_TESLA_P100
オレゴン(us-west1 $1.6790
アイオワ(us-central1 $1.6790
サウスカロライナ(us-east1 $1.6790
NVIDIA_TESLA_T4
オレゴン(us-west1 $0.4025
アイオワ(us-central1 $0.4025
サウスカロライナ(us-east1 $0.4025
NVIDIA_TESLA_V100
オレゴン(us-west1 $2.8520
アイオワ(us-central1 $2.8520

ヨーロッパ

アクセラレータ - 1 時間あたりの料金
NVIDIA_TESLA_K80
ベルギー(europe-west1 $0.5635
NVIDIA_TESLA_P4
オランダ(europe-west4 $0.7475
NVIDIA_TESLA_P100
ベルギー(europe-west1 $1.8400
NVIDIA_TESLA_T4
ロンドン(europe-west2 $0.4715
オランダ(europe-west4 $0.4370
NVIDIA_TESLA_V100
オランダ(europe-west4 $2.9325

アジア太平洋

アクセラレータ - 1 時間あたりの料金
NVIDIA_TESLA_K80
台湾(asia-east1 $0.5635
NVIDIA_TESLA_P4
シンガポール(asia-southeast1 $0.7475
シドニー(australia-southeast1 $0.7475
NVIDIA_TESLA_P100
台湾(asia-east1 $1.8400
NVIDIA_TESLA_T4
東京(asia-northeast1 $0.4255
シンガポール(asia-southeast1 $0.4255
ソウル(asia-northeast3 $0.4485
NVIDIA_TESLA_V100 利用できません

料金は GPU 単位です。したがって、予測ノードごとに複数の GPU を使用する場合(または、複数のノードを使用するようにバージョンをスケールする場合)は、それに応じて費用もスケールします。

AI Platform Prediction の予測では、モデルに基づく予測を提供する際に複数の仮想マシン(「ノード」)を実行します。デフォルトでは、Vertex AI により、実行するノードの数が常に自動的にスケールされます。オンライン予測の場合、ノードの数は需要の増減に応じてスケールされます。各ノードで複数の予測リクエストにレスポンスできます。バッチ予測の場合、ノードの数はジョブの実行にかかる合計時間を短縮するようにスケールされます。予測ノードのスケール方法はカスタマイズできます。

各ノードでモデルを実行した時間に対して料金が発生します。以下が課金対象の時間となります。

  • ノードによるバッチ予測ジョブの処理時間
  • ノードによるオンライン予測リクエストの処理時間
  • ノードがオンライン予測の準備状態になっている時間

1 つのノードを 1 時間実行する料金が 1 ノード時間です。予測ジョブの料金の表にはノード時間あたりの料金が記載されています。この料金は各リージョンで異なり、オンライン予測とバッチ予測の間でも異なります。

ノード時間は小数単位で増やすことができます。たとえば、1 つのノードを 30 分間実行すると 0.5 ノード時間となります。

従来の(MLS1)マシンタイプとバッチ予測の料金計算

  • ノードの実行時間は 1 分単位で測定され、端数は切り上げられます。たとえば、ノードの実行時間が 20.1 分間の場合、21 分間として料金を計算します。
  • ノードの実行時間が 10 分未満の場合は 10 分間に切り上げられます。たとえば、ノードの実行時間が 3 分間しかない場合、10 分間として料金を計算します。

Compute Engine(N1)マシンタイプの料金計算

  • ノードの実行時間は、30 秒単位で課金されます。つまり 30 秒ごとに、ノードがその時点で使用している vCPU、RAM、GPU リソースの 30 秒分の価格でプロジェクトに対して課金されます。

予測ノードの自動スケーリングの詳細

オンライン予測 バッチ予測
スケーリングでは、個々のリクエストのレイテンシを低減することが優先されます。このサービスでは、リクエストへの対応後、数分間にわたってモデルが待機状態に維持されます。 スケーリングでは、ジョブの合計経過時間を短縮することが優先されます。
スケーリングは毎月の合計料金に影響を与えます。リクエストの数や頻度が増えるほど、使用されるノード数も多くなります。 スケールすると、新しいノードの立ち上げに関連するオーバーヘッドが若干発生しますが、ジョブの料金にはほとんど影響しません。

お客様は、トラフィック量に応じてサービスにスケールさせる(自動スケーリング)ことも、レイテンシを回避するために継続実行ノード数を設定する(手動スケーリング)こともできます。

  • 自動スケーリングを選択した場合、ノード数は自動的にスケールされ、トラフィックがない期間はゼロにスケールダウンされます。
  • 手動スケーリングを選択した場合は、常時実行されるノードの数を指定する必要があります。この場合、デプロイから始まりモデル バージョンを削除するまで、ノードが実行されているすべての時間が課金対象になります。
スケーリングに影響を与える方法として、1 つのバッチ予測に使用するノードの最大数を設定したり、モデルのデプロイ時にモデルで実行し続けるノード数を設定したりできます。

最低使用料金 10 分

前述のとおり、ノードの実行時間が 10 分未満の場合、10 分間として課金されます。たとえば、自動スケーリングを使用するとします。トラフィックがない期間中は、ノードが使用されません。1 つのオンライン予測リクエストを受け取った場合、そのリクエストを処理するためにノードが 1 つスケールアップされます。このノードはリクエストの処理終了後、引き続き準備状態で数分間実行され、その後に実行が停止されます。実行時間が 10 分未満であっても、このノードの作業に対して 10 ノード分間(0.17 ノード時間)の料金が請求されます。

または、ノードが 1 つスケールアップされ、10 分以内に多数のオンライン予測リクエストを処理してからシャットダウンした場合も、10 ノード分間で課金されます。

特定の時間に実行されるノードの数を正確に制御するために、手動スケーリングを利用できます。ただし、ノードの実行時間が 10 分未満の場合も、10 分間として課金されます。

詳しくは、ノードの割り当てとスケーリングをご覧ください。

予測ジョブの計算の例

南北アメリカ リージョンのある不動産会社が、営業対象地域の住宅価格の週次予測ジョブを実行しているとします。ある月、4 週間分の予測ジョブをそれぞれ 3920427738493961 のバッチで実行しました。ジョブは 1 つのノードに制限され、各インスタンスの処理には平均で 0.72 秒かかりました。

まず、各ジョブの実行時間を計算します。

3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes
4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes
3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes
3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes

どのジョブも実行時間が 10 分を超えているため、処理時間 1 分ごとに課金されます。

($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964

1 か月の総額は $0.26 になります。

この例では、ジョブが単一ノードで実行され、入力インスタンスごとに一定の時間がかかったと想定しています。実際の使用では、必ず複数のノードを考慮に入れ、各ノードの実際の実行時間を計算に使用してください。

Vertex Explainable AI の料金

Vertex Explainable AI は、予測料金に対して追加の料金は発生しません。ただし、説明を処理するには通常の予測よりも時間を要するため、自動スケーリングで Vertex Explainable AI を多用すると、開始されるノードが増加し、予測料金が増加する可能性があります。

Vertex Pipelines

Vertex Pipelines では、パイプライン実行ごとに $0.03 の実行料金が課金されます。プレビュー リリース中は、実行料金が請求されません。また、パイプライン コンポーネントによって消費される Compute Engine リソースなど、Vertex Pipelines で使用する Google Cloud リソースの料金も発生します(Vertex AI Training と同じ料金が発生します)。また、パイプラインによって呼び出されるサービス(Dataflow など)の費用はお客様の負担となります。

Vertex Feature Store

Feature Store の料金は、オンラインとオフラインのストレージの特徴データ量と、オンラインの提供状況に基づきます。ノード時間は、仮想マシンが特徴データの提供に費やした時間、または特徴データ リクエスト処理の待機に費やした時間を表します。

オペレーション 料金
オンライン ストレージ $0.25/GB/月
オフライン ストレージ $0.023/GB/月
オンライン サービング 1 ノード、1 時間あたり $0.94
バッチ エクスポート $0.005/GB

Vertex ML Metadata

Vertex ML Metadata はプレビュー期間中は無料です。

メタデータ ストレージはバイナリ ギガバイト(GiB)単位で測定されます。1 GiB は 1,073,741,824 バイトです。この測定単位は、gibibyteとも呼ばれます。一般提供の時点で、Vertex ML Metadata ではメタデータ ストレージとして 1 か月 1 ギビバイト(GiB)あたり $10 が課金されます。

Vertex TensorBoard

Vertex TensorBoard は、プレビュー期間中は無料です。また、Cloud Storage に保存されている TensorBoard ログなど、Vertex TensorBoard で使用する Google Cloud リソースの料金も発生します。

Vertex Vizier

Vertex Vizier は、Vertex AI 内のブラックボックス最適化サービスです。Vizier の料金モデルは次のとおりです。

  • RANDOM_SEARCHGRID_SEARCH を使用するトライアルでは、料金は発生しません。詳しくは、検索アルゴリズムに関する記事をご覧ください。
  • Vizier のトライアルは月あたり 100 件まで無料で利用できます(RANDOM_SEARCHGRID_SEARCH を使用するトライアルはこの合計数にカウントされません)。
  • Vizier を 100 件以上試用すると、同じ月の試用期間の終了後、1 件のトライアルにつき 1 ドルが課金されます(RANDOM_SEARCH または GRID_SEARCH を使用するトライアルでは料金は発生しません)。

Vertex Matching Engine

Vertex Matching Engine の料金は次のとおりの構成です。

  • デプロイされたインデックスをホストするために使用される各 VM のノード時間あたりの料金。
  • 新しいインデックスの作成と既存のインデックスの更新の料金。

プレビュー リリースのノード時間あたりの料金は、一般提供時の料金よりも 40% 割引です。

リージョン ノード時間あたりの料金(40%割引を含む)
us-central1 $0.7952
asia-southeast1 $0.936

プレビュー期間中のインデックスの作成と更新は無料です。一般提供時の料金は、処理されるデータ 1 GB あたり $3 になります。

ノード時間あたりの料金は、2 つの別々の SKU として請求されます。

  • vCPU 費用、vCPU 時間で測定。各インデックス ホスティング ノードは、16 個の vCPU で構成されています。
  • RAM 費用、GB 時間で測定。各インデックス ホスティング ノードは、60 GB の RAM で構成されています。
SKU リージョン ノード時間あたりの料金(40%割引を含む)
vCPU us-central1 $0.0332
asia-southeast1 $0.0390
RAM us-central1 $0.0044
asia-southeast1 $0.0052

以下の各表は、Matching Engine が一般提供される各リージョンにおけるインデックス処理の料金をまとめたものです。

リージョン ノード時間あたりの料金
us-central1 $1.0640
us-east1 $1.0640
us-east4 $1.1984
us-west1 $1.0640
asia-southeast1 $1.3126
europe-west1 $1.1715

インデックスの作成中と更新中に処理されるデータはバイナリ ギガバイト(GiB)単位で測定されます。1 GiB は 1,073,741,824 バイトです。この測定単位は、gibibyteとも呼ばれます。

一般提供(GA)の時点で、Vertex Matching Engine では、すべてのリージョンで処理されたデータに対して、1 ギビバイト(GiB)あたり $3 が課金されます。

Vertex Model Monitoring

Vertex AI を使用すると、モデルを本番環境にデプロイした後の、モデルの継続的な効果をモニタリングできます。詳細については、Vertex Model Monitoring の概要をご覧ください。

Vertex Model Monitoring を使用すると、次の料金が発生します。

  • 提供されたトレーニング データや BigQuery テーブルに記録された予測データなど、分析されたすべてのデータに対して 1 GB あたり $3.50。
  • アトリビューション モニタリングが有効になっている場合の BigQuery ストレージや Batch Explain など、Model Monitoring で使用するほかの Google Cloud 製品の料金。

Vertex Model Monitoring は、リージョン us-central1europe-west4asia-east1asia-southeast1 でサポートされています。料金はすべてのリージョンで同じです。

データサイズが測定されるのは、TfRecord 形式に変換された後です。

Vertex Model Monitoring ジョブを設定すると、トレーニング データセットに 1 回限りの料金が発生します。

予測データセットは、オンライン予測サービスから収集されたログで構成されています。予測リクエストはさまざまな時間枠で到着するため、時間枠ごとにデータが収集され、各予測ウィンドウで分析されたデータの合計を使用して請求額が計算されます。

例: データ サイエンティストは、モデルに属する予測トラフィックに対してモデルのモニタリングを実行します。

  • モデルは、BigQuery データセットからトレーニングされます。TfRecord への変換後のデータサイズは 1.5 GB です。
  • 午後 1 時から午後 2 時の間に記録された予測データは 0.1 GB、午後 3 時から午後 4 時の間に記録された予測データは 0.2 GB です。
  • モデル モニタリング ジョブを設定するための合計料金は次のとおりです。

    (1.5 GB * $3.50) + ((0.1 GB + 0.2 GB) * $3.50) = $6.30

Vertex Notebooks、Deep Learning Containers、Deep Learning VM Images、AI Platform Pipelines

Deep Learning Containers、Deep Learning VM Image、AI Platform Pipelines の料金は、使用するコンピューティング リソースに基づいて計算されます。これらのリソースは、Google Compute Engine と Google Cloud Storage に現在支払うのと同じレートで課金されます。

Vertex Notebooks については、インフラストラクチャの使用量に加えて、次の表に示すように少額の管理手数料が適用されます。

SKU 1 コアあたりの料金/時間
vCPU $.005
T4、K80、P4 GPU $.05
P100、V100、A100 GPU $.30

コンピューティングの費用に加えて、使用した Google Cloud リソースの料金も発生します。次に例を示します。

  • データ分析サービス: ノートブック内で SQL クエリを発行すると、BigQuery のコストが発生します(BigQuery の料金をご覧ください)。

  • 顧客管理の暗号鍵: 顧客管理の暗号鍵を使用すると費用が発生します。Notebooks インスタンスで Cloud Key Management Service 鍵が使用されると、そのオペレーションの費用は Cloud KMS 鍵オペレーションの料率で請求されます(Cloud KMS の料金をご覧ください)。

Data Labeling

Vertex AI を使用すると、カスタム機械学習モデルのトレーニングに使用するデータのコレクションに対し、ヒューマン ラベリングをリクエストできます。サービスの料金は、ラベル付けタスクのタイプに基づいて計算されます。

  • 通常のラベル付けタスクでは、アノテーション単位の数によって料金が決まります。
    • 画像分類タスクでは、画像の数とラベル付け担当者の数で単位が決定されます。たとえば、3 人のラベル付け担当者の画像は、1 × 3 = 3 の単位としてカウントされます。シングルラベル分類とマルチラベル分類の料金は同じです。
    • 画像境界ボックスタスクでは、画像内で識別された境界ボックスの数とラベル付け担当者の数によって単位が決定されます。たとえば、2 つの境界ボックスと 3 人のラベル付け担当者の画像の場合、2 × 3 = 6 単位としてカウントされます。境界ボックスのない画像は課金されません。
    • 画像セグメンテーション / 回転ボックス / ポリライン / ポリゴンタスクの場合、単位は画像境界ボックスタスクと同じ方法で決定されます。
    • 動画分類タスクの場合、単位は動画の長さ(料金の単位は 5 秒)とラベル付け担当者の数によって決定されます。たとえば、3 人のラベル付け担当者の 25 秒の動画は、25 ÷ 5 × 3 = 15 単位としてカウントされます。シングルラベル分類とマルチラベル分類の料金は同じです。
    • 動画のオブジェクト トラッキング タスクの場合、単位は動画内で識別されたオブジェクトの数とラベル付け担当者の数によって決定されます。たとえば、2 つのオブジェクトと 3 人のラベル付け担当者の動画の場合、2 × 3 = 6 単位としてカウントされます。オブジェクトのない動画は課金されません。
    • 動画イベントタスクでは、動画オブジェクト トラッキング タスクと同じ方法で単位が決定されます。
    • テキスト分類タスクでは、単位はテキストの長さ(料金の単位は 50 単語)とラベル付け担当者の数によって決定されます。たとえば、100 単語と 3 人のラベル付け担当者を含む 1 つのテキストは、100 ÷ 50 × 3 = 6 単位としてカウントされます。シングルラベル分類とマルチラベル分類の料金は同じです。
    • テキストの感情タスクの場合、テキスト分類タスクと同じ方法で単位が決定されます。
    • テキスト エンティティ抽出タスクの場合、単位はテキストの長さ(料金の単位は 50 単語)、識別されたエンティティの数、ラベル付け担当者の数によって決定されます。たとえば、100 単語、2 つのエンティティ、3 人のラベル付け担当者を含むテキストは、100 ÷ 50 × 2 × 3 = 12 単位としてカウントされます。エンティティのないテキストは課金されません。
  • 画像 / 動画 / テキスト分類とテキスト感情のタスクでは、ラベルセットのサイズが大きすぎると、ラベル付け担当者がクラスを追跡できなくなる可能性があります。その結果、ラベル付け担当者には一度に最大 20 個のクラスが送信されます。たとえば、ラベル付けタスクのラベルセット サイズが 40 の場合、各データ項目は人間による審査 40 ÷ 20 = 2 回送信され、料金(上記で算出)の 2 倍が請求されます。

  • カスタム ラベラー機能を有効にするラベリング タスクの場合、各データ項目は 1 つのカスタム ラベラー単位としてカウントされます。

  • モデルで生成されるアノテーションを含むデータ項目のアクティブな学習ラベリング タスクの場合(人間のラベラーのサポートなし)、各データ項目は 1 つのアクティブな学習単位としてカウントされます。

  • 人間のラベラーによって生成されたアノテーションを含むデータ項目のアクティブな学習ラベル付けタスクの場合、各データ項目は上記のような標準のラベル付けタスクとしてカウントされます。

以下の表では、各目的の単位別に、ラベリング担当者 1 名および 1,000 ユニットあたりの料金を示しています。Google Cloud の各プロジェクトで、月間 5 万単位までは階層 1 の料金が適用されます。月間 5 万単位を超える場合は、それ以降、月 95 万単位まで階層 2 の料金が適用されます。階層 2 の最大ユニット数は、100 万ユニットです。 月間 100 万単位を越える場合の料金については、お問い合わせください

データ型 目的 単位 階層 1 階層 2
画像 分類 画像 $35 $25
境界ボックス 境界ボックス $63 $49
セグメンテーション セグメント $870 $850
回転ボックス 境界ボックス $86 $60
ポリゴン / ポリライン ポリゴン / ポリライン $257 $180
動画 分類 5 秒の動画 $86 $60
オブジェクト トラッキング 境界ボックス $86 $60
動作認識 30 秒の動画内のイベント $214 $150
テキスト 分類 50 単語 $129 $90
感情 50 単語 $200 $140
エンティティの抽出 エンティティ $86 $60
能動的学習 すべて データ項目 $80 $56
カスタム ラベラー すべて データ項目 $80 $56

Cloud Storage の利用

このドキュメントに記載されている費用のほかに、Vertex AI のライフサイクル中は、データやプログラム ファイルを Cloud Storage バケットに保存する必要があります。このストレージは、Cloud Storage 料金ポリシーの対象になります。

次の場合は Cloud Storage の利用が必須となります。

  • カスタム トレーニング モデル用のトレーニング アプリケーション パッケージをステージングする。

  • トレーニングの入力データを保存する。

  • トレーニング ジョブの出力を保存する。Vertex AI の場合、こうした出力を長期間保存する必要はありません。オペレーションが完了したら、すぐにファイルを削除できます。

リソースを管理するための無料のオペレーション

AI Platform が提供するリソース管理オペレーションは、無料で利用できます。ただし、AI Platform 割り当てポリシーにより、オペレーションの一部が制限されることがあります。

リソース 無料のオペレーション
モデル create、get、list、delete
バージョン create、get、list、delete、setDefault
ジョブ get、list、cancel
オペレーション get、list、cancel、delete

Google Cloud の費用

分析する画像を Cloud Storage に保存する場合や、他の Google Cloud リソースを Vertex AI と併用する場合は、そのサービスの利用料も請求の対象となります。

Cloud Console で現在の課金ステータス(使用状況や現在の請求額を含む)を確認するには、[お支払い] ページをご覧ください。アカウントの管理について詳しくは、Cloud Billing のドキュメントまたは課金と支払いのサポートをご覧ください。

次のステップ