Vertex AI の料金

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

このページでは、Vertex AI の生成 AI の料金について説明します。ML Platform や MLOps サービスなど、Vertex AI のその他の料金については、Vertex AI の料金ページをご覧ください。

Google モデル

Gemini

Vertex AI のマルチモーダル モデルでは、テキストまたはメディア(画像、動画)を入力できます。テキスト入力は、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。つまり、トークンあたり約 4 文字になります。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後に、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。メディア入力は、画像ごと、または秒ごと(動画)に課金されます。

モデル 機能 タイプ 価格
(=< 128,000 入力トークン)
価格
(入力トークンが 128,000 個以上)
Gemini 1.5 Flash マルチモーダル 画像入力
動画入力
テキスト入力
音声入力
$0.00002 / 画像
$0.00002 / 秒
$0.00001875 / 1,000 文字
$0.000002 / 秒
$0.00004 / 画像
$0.00004 / 秒
$0.0000375 / 1,000 文字
$0.000004 / 秒
テキスト出力 $0.000075 / 1,000 文字 $0.00015 / 1,000 文字
チューニング* トレーニング トークン $8 / 100 万トークン
Gemini 1.5 Pro マルチモーダル 画像入力
動画入力
テキスト入力
音声入力
$0.00032875 / 画像
$0.00032875 / 秒
$0.0003125 / 1,000 文字
$0.00003125 / 秒
$0.0006575 / 画像
$0.0006575 / 秒
$0.000625 / 1,000 文字
$0.0000625 / 秒
テキスト出力 $0.00125 / 1,000 文字 $0.0025 / 1,000 文字
チューニング* トレーニング トークン $80 / 100 万トークン
Gemini 1.0 Pro マルチモーダル 画像入力
動画入力
テキスト入力
$0.0025 / 画像
$0.002 / 秒
$0.000125 / 1,000 文字
テキスト出力 $0.000375 / 1k 文字
Google 検索によるグラウンディング テキスト 根拠づけのリクエスト $35 / 1,000 リクエスト(1 日あたり最大 100 万リクエスト)。
1 日あたり 100 万件を超えるリクエストが必要な場合は、
Google のアカウント担当者にお問い合わせください。

* 料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* クエリ コンテキストが 128, 000 を超える場合、すべてのトークンに長いコンテキスト レートが請求されます。
* Gemini モデルは 50% 割引でバッチモードで利用できます。
* Gemini 1.0 Pro は、最大 32K のコンテキスト ウィンドウのみをサポートします。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像と同等になります。
* チューニング済みモデルのエンドポイントの予測料金はベースモデルと同じです。
* Google 検索によるグラウンディング: 動的取得を使用して費用を最適化している場合、ウェブからのグラウンディング サポート URL がレスポンスに 1 つ以上含まれているリクエストのみが、Google 検索によるグラウンディングに対して課金されます。Gemini の料金が常に適用されます。

Imagen

Vertex AI の Imagen を使用すると、指定したテキスト プロンプトに基づいて新しい画像の生成や画像の編集を行ったり、定義したマスク領域を使用して画像の一部のみを編集したりできるほか、さまざまな機能を利用できます。

モデル 機能 説明 入力 出力 料金
Imagen 3 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.04
Imagen 3 Fast 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.02
Imagen 2、Imagen 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.020
画像編集 マスクなしまたはマスクを使用して画像を編集する 画像 / テキスト プロンプト 画像 画像 1 枚あたり $0.020
アップスケーリング 生成された画像の解像度を 2K と 4K に上げる 画像 画像 画像 1 枚あたり $0.003
ファインチューニング ユーザーが指定した「テーマ」を Imagen のプロンプトで使用できるようにする(少数ショット トレーニング) テキスト識別子と 4-8 枚の画像を含めたテーマ ファイン チューニングされたモデル(ユーザーが提供したテーマでのトレーニング後) 1 ノード時間あたりの $(Vertex AI カスタム トレーニング料金)
画像キャプション 画像に短い / 長いテキスト キャプションを生成 画像 テキスト キャプション $0.0015 / 画像
Visual Q&A 画像に関連した質問に対し回答を提供 画像 / テキスト プロンプト テキスト回答 $0.0015 / 画像

料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

埋め込み

モデル 機能 説明 入力 出力 料金
multimodalembedding マルチモーダルのエンベディング: テキスト テキストを入力としてエンベディングを生成 テキスト エンベディング $0.0002 / 入力 1,000 文字
マルチモーダルのエンベディング: 画像 画像を入力としてエンベディングを生成 画像 エンベディング $0.0001 / 画像入力
マルチモーダルのエンベディング: Video Plus 動画プラス 動画 エンベディング(動画 1 分あたり最大 15 個のエンベディング) 動画 1 秒あたり $0.0020
マルチモーダルのエンベディング: 動画標準 動画 標準 動画 エンベディング(動画 1 分あたり最大 8 個のエンベディング) 動画 1 秒あたり $0.0010
マルチモーダルのエンベディング: 動画の基本 必須の動画 動画 エンベディング(動画 1 分あたり最大 4 つのエンベディング) 動画 1 秒あたり $0.0005
モデル リージョン 1,000 文字あたりの料金
テキスト用エンベディング 入力 グローバル
  • オンライン リクエスト: $0.000025
  • バッチ リクエスト: $0.00002
出力 グローバル
  • オンライン リクエスト: 無料
  • バッチ リクエスト: 無料

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

コード補完

Vertex AI における生成 AI の利用では、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後で、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。

モデル リージョン 1,000 文字あたりの料金
コード補完用 Codey 入力 グローバル
  • オンライン リクエスト: $0.00025
出力 グローバル
  • オンライン リクエスト: $0.0005

料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

翻訳(テキスト)

Vertex AI API と翻訳 LLM を使用してテキストを翻訳する。LLM 翻訳は、従来の翻訳モデルよりも流暢で人間味がある傾向がありますが、対応言語は限られています(詳細)

モデル メソッド 用途 100 万文字あたりの料金
LLM テキスト翻訳プレビュー* 1 か月あたりの入力文字数

100 万文字あたり $10*

1 か月あたりの出力文字数

100 万文字あたり $10*

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* 料金は、モデルによって処理された 1 文字あたりの料金です。カウントされる文字数について詳しくは、課金対象の文字数をご覧ください。

コンテキスト キャッシュ保存

コンテキスト キャッシュを使用すると、入力テキストまたはメディアのコンテキスト部分を Gemini モデルにキャッシュに保存することで、Gemini 入力トークンの処理費用を 75% 削減し、コンテンツ生成のレイテンシを 75% 削減できます。「コンテキスト キャッシュ ストレージ」の料金は、ユーザーが制御できるキャッシュに保存される期間によって決まります。キャッシュに保存されたコンテキストを作成すると、ユーザーには標準の入力トークンのコストが請求されます。入力データのキャッシュ ヒットは、通常の入力コストではなく、減らされたレート「キャッシュ入力」で課金されます。ストレージと入力の両方のデータサイズは、Gemini の入力料金と同じ方法で計算されます。

モデル 機能 タイプ 価格(=< 128,000 入力トークン) 価格(入力トークン 128,000 個超)
Gemini 1.5 Flash キャッシュされた入力 画像入力
動画入力
テキスト入力
音声入力
0.000005 / 画像
0.000005 / 秒
0.0000046875 / 1,000 文字
0.0000005 / 秒
0.00001 / 画像
0.00001 / 秒
0.000009375 / 1,000 文字
0.000001 / 秒
コンテキスト キャッシュ ストレージ 画像入力
動画入力
テキスト入力
音声入力
0.000263 / 画像 / 時間
0.000263/ 秒 / 時間
0.00025 / 1,000 文字 / 時間
0.000025 / 秒 / 時間
Gemini 1.5 Pro キャッシュされた入力 画像入力
動画入力
テキスト入力
音声入力
0.0000821875 / 画像
0.0000821875 / 秒
0.000078125 / 1,000 文字
0.0000078125 / 秒
0.000164375 / 画像
0.000164375 / 秒
0.00015625 / 1,000 文字
0.000015625 / 秒
コンテキスト キャッシュ ストレージ 画像入力
動画入力
テキスト入力
音声入力
0.0011835 / 画像 / 時間
0.0011835/ 秒 / 時間
0.001125 / 1,000 文字 / 時間
0.0001125 / 秒 / 時間

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

キャッシュに保存された費用の計算例

ユーザーが TTL 2 時間で 250,000 文字のキャッシュ コンテキストを作成し、その後 2 時間に Gemini 1.5 Pro モデルに 20 件のリクエストを送信し、各リクエストについて、キャッシュに保存されたコンテキストに 200 文字のクエリが追加され、出力が 400 文字である場合、合計料金は次のように計算されます。

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

料金計算の例

ユーザーが PaLM Text Bison モデルに 5 つの別々のリクエストを送信し、それぞれのリクエストが入力 200 文字と出力 400 文字の場合、合計の料金は以下のように計算されます。

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

パートナーのモデル

パートナー モデルは、Google パートナーが開発した生成 AI モデルの厳選されたリストです。パートナー モデルはマネージド API として提供されます。詳細については、パートナー モデルの概要をご覧ください。以下のセクションでは、Google パートナー モデルの料金について詳しく説明します。

AI21 Lab のモデル

モデル 料金
Jamba 1.5 Large 入力: $2 / 100 万トークン
出力: $8 / 100 万トークン
Jamba 1.5 Mini 入力: $0.20 / 100 万トークン
出力: $0.40 / 100 万トークン

Anthropic の Claude モデル

モデル 料金
Claude 3.5 俳句 入力: $1.00 / 100 万トークン
出力: $5.00 / 100 万トークン
Claude 3.5 Sonnet v2 入力: $3 / 100 万トークン
出力: $15 / 100 万トークン
Claude 3.5 Sonnet 入力: $3 / 100 万トークン
出力: $15 / 100 万トークン
Claude 3 Haiku 入力: $0.25 / 100 万トークン
出力: $1.25 / 100 万トークン
Claude 3 Sonnet 入力: $3 / 100 万トークン
出力: $15 / 100 万トークン
Claude 3 Opus 入力: $15 / 100 万トークン
出力: $75 / 100 万トークン

Meta の Llama モデル

モデル 料金
Llama 3.1 405B 入力: $5 / 100 万トークン
出力: $16 / 100 万トークン

Mistral AI のモデル

モデル 料金
Mistral Large(2407) 入力: $2 / 100 万トークン
出力: $6 / 100 万トークン
Mistral Nemo 入力: $0.15 / 100 万トークン
出力: $0.15 / 100 万トークン
Codestral 入力: $0.20 / 100 万トークン
出力: $0.60 / 100 万トークン

カスタム見積もりをリクエストする

Google Cloud の従量課金制では、使用したサービスに対してのみ料金が発生します。カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。
お問い合わせ