Vertex AI の料金
料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
このページでは、Vertex AI の生成 AI の料金について説明します。以下を含む Vertex AI のその他すべての料金については、 ML プラットフォームと MLOps サービスについては、Vertex AI の料金ページをご覧ください。
Google モデル
Gemini
Vertex AI のマルチモーダル モデルでは、テキストまたは (画像、動画)。テキスト入力は、テキスト入力として 入力(プロンプト)と出力(レスポンス)の 1,000 文字ごと。キャラクターは 空白はカウントから除外されます。 トークンあたり約 4 文字になります。予測リクエストによって レスポンスは入力に対してのみ課金されます。各課金の最終日 1 セント($0.01)未満の小数部分は、1 セントに丸められます。メディア入力 は、画像ごと、または秒ごと(動画)に課金されます。
モデル | 機能 | タイプ | 価格 (=< 128,000 コンテキスト ウィンドウ) |
価格 (128,000 を超えるコンテキスト ウィンドウ) |
---|---|---|---|---|
Gemini 1.5 Flash | マルチモーダル | 画像入力 動画入力 テキスト入力 音声入力 |
$0.00002 / 画像 $0.00002 / 秒 $0.00001875 / 1,000 文字 $0.000002 / 秒 |
$0.00004 / 画像 $0.00004 / 秒 $0.0000375 / 1,000 文字 $0.000004 / 秒 |
テキスト出力 | $0.000075 / 1,000 文字 | $0.00015 / 1,000 文字 | ||
Gemini 1.5 Pro | マルチモーダル | 画像入力 動画入力 テキスト入力 音声入力 |
$0.001315 / 画像 $0.001315 / 秒 $0.00125 / 1,000 文字 $0.000125 / 秒 |
$0.00263 / 画像 $0.00263 / 秒 $0.0025 / 1,000 文字 $0.00025 / 秒 |
テキスト出力 | $0.00375 / 1,000 文字 | $0.0075 / 1,000 文字 | ||
Gemini 1.0 Pro | マルチモーダル | 画像入力 動画入力 テキスト入力 |
$0.0025 / 画像 $0.002 / 秒 $0.000125 / 1,000 文字 |
|
テキスト出力 | $0.000375 / 1k 文字 | |||
Google 検索によるグラウンディング | テキスト | 根拠づけのリクエスト | $35 / 1,000 リクエスト(1 日あたり最大 100 万リクエスト)。 この数を増やす必要がある場合は、アカウント チームにお問い合わせください。 1 日あたりのリクエスト数は 100 万件未満。 |
* 料金は米ドル(USD)で表しています。
米ドル以外の通貨でお支払いの場合は、
Cloud Platform SKU
適用されます。
* クエリ コンテキストが 128, 000 を超える場合、すべてのトークンにロング コンテキスト レートで課金されます。
* Gemini モデルは 50% 割引でバッチモードで利用できます。
* Gemini 1.0 Pro は、最大 32K のコンテキスト ウィンドウのみをサポートします。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像と同等
Imagen
Vertex AI の Imagen を使用すると、指定したテキスト プロンプトに基づいて新しい画像の生成や画像の編集を行ったり、定義したマスク領域を使用して画像の一部のみを編集したりできるほか、さまざまな機能を利用できます。
モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
---|---|---|---|---|---|
Imagen 3 | 画像の生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.04 |
Imagen 3 Fast | 画像の生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.02 |
Imagen 2、Imagen | 画像の生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.020 |
画像編集 | マスクなしまたはマスクを使用して画像を編集する | 画像 / テキスト プロンプト | 画像 | 画像 1 枚あたり $0.020 | |
アップスケーリング | 生成された画像の解像度を 2K と 4K に上げる | 画像 | 画像 | 画像 1 枚あたり $0.003 | |
ファインチューニング | 「サブジェクト」を有効にするImagen プロンプトで使用するためにユーザーが提供(少数ショット トレーニング) | テキスト識別子と 4-8 枚の画像を含めたテーマ | ファイン チューニングされたモデル(ユーザーが提供したテーマでのトレーニング後) | 1 ノード時間あたりの $(Vertex AI カスタム トレーニング料金) | |
画像キャプション | 画像に短い / 長いテキスト キャプションを生成 | 画像 | テキスト キャプション | $0.0015 / 画像 | |
Visual Q&A | 画像に関連した質問に対し回答を提供 | 画像 / テキスト プロンプト | テキスト回答 | $0.0015 / 画像 |
料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
埋め込み
モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
---|---|---|---|---|---|
multimodalembedding | マルチモーダルのエンベディング: テキスト | テキストを入力としてエンベディングを生成 | テキスト | エンベディング | $0.0002 / 入力 1,000 文字 |
マルチモーダルのエンベディング: 画像 | 画像を入力としてエンベディングを生成 | 画像 | エンベディング | $0.0001 / 画像入力 | |
マルチモーダルのエンベディング: Video Plus | 動画プラス | 動画 | エンベディング(動画 1 分あたり最大 15 個のエンベディング) | 動画 1 秒あたり $0.0020 | |
マルチモーダルのエンベディング: 動画標準 | 動画 標準 | 動画 | エンベディング(動画 1 分あたり最大 8 個のエンベディング) | 動画 1 秒あたり $0.0010 | |
マルチモーダルのエンベディング: 動画の基本 | 必須の動画 | 動画 | エンベディング(動画 1 分あたり最大 4 つのエンベディング) | 動画 1 秒あたり $0.0005 |
モデル | 型 | リージョン | 1,000 文字あたりの料金 |
---|---|---|---|
テキスト用エンベディング | 入力 | グローバル |
|
出力 | グローバル |
|
料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
コード補完
Vertex AI における生成 AI の利用では、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストによりフィルタリングされる 入力に対してのみ課金されます。各請求期間の終了時に 1 セント(0.01 ドル)未満の小数部分は 1 セントに四捨五入されます。
モデル | 型 | リージョン | 1,000 文字あたりの料金 |
---|---|---|---|
コード補完用 Codey | 入力 | グローバル |
|
出力 | グローバル |
|
料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
翻訳(テキスト)
Vertex AI API と翻訳 LLM を使用してテキストを翻訳する。LLM 翻訳は、従来の翻訳モデルよりも流暢で人間味がある傾向がありますが、対応言語は限られています(詳細)。
モデル | メソッド | 用途 | 100 万文字あたりの料金 |
---|---|---|---|
LLM | テキスト 翻訳(プレビュー)* | 1 か月あたりの入力文字数 |
100 万文字あたり $10* |
1 か月あたりの出力文字数 |
100 万文字あたり $10* |
料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、
Cloud Platform SKU
適用されます。
* 料金は、モデルで処理される 1 文字あたりの料金です。カウントされる文字数について詳しくは、課金対象の文字数をご覧ください。
コンテキストのキャッシュ保存
コンテキスト キャッシュにより、Gemini 入力トークン処理のコストを削減できる コンテンツのコンテキスト部分をキャッシュに保存することで、コンテンツ生成の テキストやメディアを Gemini モデルに 入力しますデータの保存期間は キャッシュはユーザーが制御可能なため、「コンテキスト キャッシュ」が ストレージ」料金。キャッシュに保存されたコンテキストを作成すると、ユーザーには標準の入力トークンのコストが請求されます。入力データのキャッシュ ヒットは、通常の入力コストではなく、減らされたレート「キャッシュ入力」で課金されます。両方のデータサイズ ストレージと入力は、Gemini の入力料金と同じ方法で計算されます。
モデル | 機能 | タイプ | 料金(128,000 未満のコンテキスト ウィンドウ) | 料金(128,000 を超えるコンテキスト ウィンドウ) |
---|---|---|---|---|
Gemini 1.5 Flash | キャッシュされた入力 | 画像入力 動画入力 テキスト入力 音声入力 |
0.000005 / 画像 0.000005 / 秒 0.0000046875 / 1,000 文字 0.0000005 / 秒 |
0.00001 / 画像 0.00001 / 秒 0.000009375 / 1,000 文字 0.000001 / 秒 |
コンテキスト キャッシュ ストレージ | 画像入力 動画入力 テキスト入力 音声入力 |
0.000263 / 画像 / 時間 0.000263/ 秒 / 時間 0.00025 / 1,000 文字 / 時間 0.000025 / 秒 / 時間 |
||
Gemini 1.5 Pro | キャッシュされた入力 | 画像入力 動画入力 テキスト入力 音声入力 |
0.00032875 / 画像 0.00032875 / 秒 0.0003125 / 1,000 文字 0.00003125 / 秒 |
0.0006575 / 画像 0.0006575 / 秒 0.000625 / 1,000 文字 0.0000625 / 秒 |
コンテキスト キャッシュ ストレージ | 画像入力 動画入力 テキスト入力 音声入力 |
0.0011835 / 画像 / 時間 0.0011835/ 秒 / 時間 0.001125 / 1,000 文字 / 時間 0.0001125 / 秒 / 時間 |
料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
キャッシュに保存された費用の計算例
ユーザーが TTL 2 時間で 250,000 文字のキャッシュ コンテキストを作成し、その後その 2 時間に Gemini 1.5 Pro モデルに 20 件のリクエストを送信し、各リクエストについて、キャッシュに保存されたコンテキストに 200 文字のクエリが追加され、出力が 400 文字である場合、合計料金は次のように計算されます。
Cache Creation cost:
250,000 input characters x ($0.00125 / 1000) = $0.3125 input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached chacater inputs
2,000 total character inputs * ($0.00125 / 1000) = $.0025 character input cost
5,000,000 total cached character inputs * ($0.0003125 / 1000) = $1.5625 cached input cost
$.0025 chacater input cost + $1.5625 cached input cost = $1.565 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
.3125 cached input cost + 0.5625 cached storage cost + $1.565 input cost + $0.03 output cost = $2.47 total cost.
料金計算の例
ユーザーが PaLM Text Bison モデルに 5 つの別々のリクエストを送信し、それぞれのリクエストが入力 200 文字と出力 400 文字の場合、合計の料金は以下のように計算されます。
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
パートナーのモデル
パートナー モデルは、Google Cloud が開発した生成 AI モデルの厳選されたリストです。 Google のパートナーシップ。パートナー モデルはマネージド API として提供されます。詳細情報 詳しくは、 パートナー モデルの概要 次の表に、Google パートナー モデルの料金の詳細を示します。
Anthropic の Claude モデル
モデル | 料金 |
---|---|
Claude 3.5 Sonnet | 入力: $3 / 100 万トークン 出力: $15 / 100 万トークン |
Claude 3 Opus | 入力: $15 / 100 万トークン 出力: $75 / 100 万トークン |
Claude 3 Haiku | 入力: $0.25 / 100 万トークン 出力: $1.25 / 100 万トークン |
Claude 3 Sonnet | 入力: $3 / 100 万トークン 出力: $15 / 100 万トークン |
Mistral AI のモデル
モデル | 料金 |
---|---|
Mistral Large(2407) | 入力: $3 / 100 万トークン 出力: $9 / 100 万トークン |
Mistral Nemo 氏 | 入力: $0.30 / 100 万トークン 出力: $0.30 / 100 万トークン |
Codestral | 入力: $1 / 100 万トークン 出力: $3 / 100 万トークン |