Vertex AI の料金

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

このページでは、Vertex AI の生成 AI の料金について説明します。以下を含む Vertex AI のその他すべての料金については、 ML プラットフォームと MLOps サービスについては、Vertex AI の料金ページをご覧ください。

Google モデル

Gemini

Vertex AI のマルチモーダル モデルでは、テキストまたは (画像、動画)。テキスト入力は、テキスト入力として 入力(プロンプト)と出力(レスポンス)の 1,000 文字ごと。キャラクターは 空白はカウントから除外されます。 トークンあたり約 4 文字になります。予測リクエストによって レスポンスは入力に対してのみ課金されます。各課金の最終日 1 セント($0.01)未満の小数部分は、1 セントに丸められます。メディア入力 は、画像ごと、または秒ごと(動画)に課金されます。

モデル 機能 タイプ 価格
(=< 128,000 コンテキスト ウィンドウ)
価格
(128,000 を超えるコンテキスト ウィンドウ)
Gemini 1.5 Flash マルチモーダル 画像入力
動画入力
テキスト入力
音声入力
$0.00002 / 画像
$0.00002 / 秒
$0.00001875 / 1,000 文字
$0.000002 / 秒
$0.00004 / 画像
$0.00004 / 秒
$0.0000375 / 1,000 文字
$0.000004 / 秒
テキスト出力 $0.000075 / 1,000 文字 $0.00015 / 1,000 文字
Gemini 1.5 Pro マルチモーダル 画像入力
動画入力
テキスト入力
音声入力
$0.001315 / 画像
$0.001315 / 秒
$0.00125 / 1,000 文字
$0.000125 / 秒
$0.00263 / 画像
$0.00263 / 秒
$0.0025 / 1,000 文字
$0.00025 / 秒
テキスト出力 $0.00375 / 1,000 文字 $0.0075 / 1,000 文字
Gemini 1.0 Pro マルチモーダル 画像入力
動画入力
テキスト入力
$0.0025 / 画像
$0.002 / 秒
$0.000125 / 1,000 文字
テキスト出力 $0.000375 / 1k 文字
Google 検索によるグラウンディング テキスト 根拠づけのリクエスト $35 / 1,000 リクエスト(1 日あたり最大 100 万リクエスト)。
この数を増やす必要がある場合は、アカウント チームにお問い合わせください。
1 日あたりのリクエスト数は 100 万件未満。

* 料金は米ドル(USD)で表しています。 米ドル以外の通貨でお支払いの場合は、 Cloud Platform SKU 適用されます。
* クエリ コンテキストが 128, 000 を超える場合、すべてのトークンにロング コンテキスト レートで課金されます。
* Gemini モデルは 50% 割引でバッチモードで利用できます。
* Gemini 1.0 Pro は、最大 32K のコンテキスト ウィンドウのみをサポートします。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像と同等

Imagen

Vertex AI の Imagen を使用すると、指定したテキスト プロンプトに基づいて新しい画像の生成や画像の編集を行ったり、定義したマスク領域を使用して画像の一部のみを編集したりできるほか、さまざまな機能を利用できます。

モデル 機能 説明 入力 出力 料金
Imagen 3 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.04
Imagen 3 Fast 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.02
Imagen 2、Imagen 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.020
画像編集 マスクなしまたはマスクを使用して画像を編集する 画像 / テキスト プロンプト 画像 画像 1 枚あたり $0.020
アップスケーリング 生成された画像の解像度を 2K と 4K に上げる 画像 画像 画像 1 枚あたり $0.003
ファインチューニング 「サブジェクト」を有効にするImagen プロンプトで使用するためにユーザーが提供(少数ショット トレーニング) テキスト識別子と 4-8 枚の画像を含めたテーマ ファイン チューニングされたモデル(ユーザーが提供したテーマでのトレーニング後) 1 ノード時間あたりの $(Vertex AI カスタム トレーニング料金)
画像キャプション 画像に短い / 長いテキスト キャプションを生成 画像 テキスト キャプション $0.0015 / 画像
Visual Q&A 画像に関連した質問に対し回答を提供 画像 / テキスト プロンプト テキスト回答 $0.0015 / 画像

料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

埋め込み

モデル 機能 説明 入力 出力 料金
multimodalembedding マルチモーダルのエンベディング: テキスト テキストを入力としてエンベディングを生成 テキスト エンベディング $0.0002 / 入力 1,000 文字
マルチモーダルのエンベディング: 画像 画像を入力としてエンベディングを生成 画像 エンベディング $0.0001 / 画像入力
マルチモーダルのエンベディング: Video Plus 動画プラス 動画 エンベディング(動画 1 分あたり最大 15 個のエンベディング) 動画 1 秒あたり $0.0020
マルチモーダルのエンベディング: 動画標準 動画 標準 動画 エンベディング(動画 1 分あたり最大 8 個のエンベディング) 動画 1 秒あたり $0.0010
マルチモーダルのエンベディング: 動画の基本 必須の動画 動画 エンベディング(動画 1 分あたり最大 4 つのエンベディング) 動画 1 秒あたり $0.0005
モデル リージョン 1,000 文字あたりの料金
テキスト用エンベディング 入力 グローバル
  • オンライン リクエスト: $0.000025
  • バッチ リクエスト: $0.00002
出力 グローバル
  • オンライン リクエスト: 無料
  • バッチ リクエスト: 無料

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

コード補完

Vertex AI における生成 AI の利用では、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストによりフィルタリングされる 入力に対してのみ課金されます。各請求期間の終了時に 1 セント(0.01 ドル)未満の小数部分は 1 セントに四捨五入されます。

モデル リージョン 1,000 文字あたりの料金
コード補完用 Codey 入力 グローバル
  • オンライン リクエスト: $0.00025
出力 グローバル
  • オンライン リクエスト: $0.0005

料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

翻訳(テキスト)

Vertex AI API と翻訳 LLM を使用してテキストを翻訳する。LLM 翻訳は、従来の翻訳モデルよりも流暢で人間味がある傾向がありますが、対応言語は限られています(詳細)

モデル メソッド 用途 100 万文字あたりの料金
LLM テキスト 翻訳プレビュー* 1 か月あたりの入力文字数

100 万文字あたり $10*

1 か月あたりの出力文字数

100 万文字あたり $10*

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、 Cloud Platform SKU 適用されます。
* 料金は、モデルで処理される 1 文字あたりの料金です。カウントされる文字数について詳しくは、課金対象の文字数をご覧ください。

コンテキストのキャッシュ保存

コンテキスト キャッシュにより、Gemini 入力トークン処理のコストを削減できる コンテンツのコンテキスト部分をキャッシュに保存することで、コンテンツ生成の テキストやメディアを Gemini モデルに 入力しますデータの保存期間は キャッシュはユーザーが制御可能なため、「コンテキスト キャッシュ」が ストレージ」料金。キャッシュに保存されたコンテキストを作成すると、ユーザーには標準の入力トークンのコストが請求されます。入力データのキャッシュ ヒットは、通常の入力コストではなく、減らされたレート「キャッシュ入力」で課金されます。両方のデータサイズ ストレージと入力は、Gemini の入力料金と同じ方法で計算されます。

モデル 機能 タイプ 料金(128,000 未満のコンテキスト ウィンドウ) 料金(128,000 を超えるコンテキスト ウィンドウ)
Gemini 1.5 Flash キャッシュされた入力 画像入力
動画入力
テキスト入力
音声入力
0.000005 / 画像
0.000005 / 秒
0.0000046875 / 1,000 文字
0.0000005 / 秒
0.00001 / 画像
0.00001 / 秒
0.000009375 / 1,000 文字
0.000001 / 秒
コンテキスト キャッシュ ストレージ 画像入力
動画入力
テキスト入力
音声入力
0.000263 / 画像 / 時間
0.000263/ 秒 / 時間
0.00025 / 1,000 文字 / 時間
0.000025 / 秒 / 時間
Gemini 1.5 Pro キャッシュされた入力 画像入力
動画入力
テキスト入力
音声入力
0.00032875 / 画像
0.00032875 / 秒
0.0003125 / 1,000 文字
0.00003125 / 秒
0.0006575 / 画像
0.0006575 / 秒
0.000625 / 1,000 文字
0.0000625 / 秒
コンテキスト キャッシュ ストレージ 画像入力
動画入力
テキスト入力
音声入力
0.0011835 / 画像 / 時間
0.0011835/ 秒 / 時間
0.001125 / 1,000 文字 / 時間
0.0001125 / 秒 / 時間

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

キャッシュに保存された費用の計算例

ユーザーが TTL 2 時間で 250,000 文字のキャッシュ コンテキストを作成し、その後その 2 時間に Gemini 1.5 Pro モデルに 20 件のリクエストを送信し、各リクエストについて、キャッシュに保存されたコンテキストに 200 文字のクエリが追加され、出力が 400 文字である場合、合計料金は次のように計算されます。

Cache Creation cost:
250,000 input characters x ($0.00125 / 1000) = $0.3125 input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached chacater inputs
2,000 total character inputs * ($0.00125 / 1000) = $.0025 character input cost

5,000,000 total cached character inputs * ($0.0003125 / 1000) = $1.5625 cached input cost
$.0025 chacater input cost + $1.5625 cached input cost = $1.565 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
.3125 cached input cost + 0.5625 cached storage cost + $1.565 input cost + $0.03 output cost = $2.47 total cost.

料金計算の例

ユーザーが PaLM Text Bison モデルに 5 つの別々のリクエストを送信し、それぞれのリクエストが入力 200 文字と出力 400 文字の場合、合計の料金は以下のように計算されます。

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

パートナーのモデル

パートナー モデルは、Google Cloud が開発した生成 AI モデルの厳選されたリストです。 Google のパートナーシップ。パートナー モデルはマネージド API として提供されます。詳細情報 詳しくは、 パートナー モデルの概要 次の表に、Google パートナー モデルの料金の詳細を示します。

Anthropic の Claude モデル

モデル 料金
Claude 3.5 Sonnet 入力: $3 / 100 万トークン
出力: $15 / 100 万トークン
Claude 3 Opus 入力: $15 / 100 万トークン
出力: $75 / 100 万トークン
Claude 3 Haiku 入力: $0.25 / 100 万トークン
出力: $1.25 / 100 万トークン
Claude 3 Sonnet 入力: $3 / 100 万トークン
出力: $15 / 100 万トークン

Mistral AI のモデル

モデル 料金
Mistral Large(2407) 入力: $3 / 100 万トークン
出力: $9 / 100 万トークン
Mistral Nemo 氏 入力: $0.30 / 100 万トークン
出力: $0.30 / 100 万トークン
Codestral 入力: $1 / 100 万トークン
出力: $3 / 100 万トークン

カスタム見積もりをリクエストする

Google Cloud の従量課金制では、使用したサービスに対してのみ料金が発生します。カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。
お問い合わせ