Vertex AI の料金

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

このページでは、Vertex AI での生成 AI の料金について説明します。ML Platform や MLOps サービスなど、Vertex AI のその他の料金については、Vertex AI の料金ページをご覧ください。

Google モデル

Gemini

Vertex AI のマルチモーダル モデルでは、テキストまたはメディア(画像、動画)を入力できます。テキスト入力は、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されるため、トークンあたりの文字数は約 4 文字になります。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後に、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。メディア入力 は、画像ごと、または秒ごと(動画)に課金されます。

モデル 機能 タイプ 料金
(= 128K 入力トークン以下)
価格
(128K 以上の入力トークン)
Gemini 1.5 Flash マルチモーダル 画像入力
動画入力
テキスト入力
音声入力
$0.00002 / 画像
$0.00002 / 秒
$0.00001875 / 1,000 文字
$0.000002 / 秒
$0.00004 / 画像
$0.00004 / 秒
$0.0000375 / 1,000 文字
$0.000004 / 秒
テキスト出力 $0.000075 / 1,000 文字 $0.00015 / 1,000 文字
チューニング* トレーニング トークン $8 / 100 万トークン
Gemini 1.5 Pro マルチモーダル 画像入力
動画入力
テキスト入力
音声入力
$0.00032875 / 画像
$0.00032875 / 秒
$0.0003125 / 1,000 文字
$0.00003125 / 秒
$0.0006575 / 画像
$0.0006575 / 秒
$0.000625 / 1,000 文字
$0.0000625 / 秒
テキスト出力 $0.00125 / 1,000 文字 $0.0025 / 1,000 文字
チューニング* トレーニング トークン $80 / 100 万トークン
Gemini 1.0 Pro マルチモーダル 画像入力
動画入力
テキスト入力
$0.0025 / 画像
$0.002 / 秒
$0.000125 / 1,000 文字
テキスト出力 $0.000375 / 1k 文字
Google 検索によるグラウンディング テキスト 根拠付けリクエスト 1,000 リクエストあたり $35(1 日あたり最大 100 万リクエスト)。
1 日あたり 100 万リクエストを超えるリクエストが必要な場合は、
アカウント チームにお問い合わせください。

* 料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* クエリ コンテキストが 128K より長い場合、すべてのトークンが長いコンテキスト料金で課金されます。
* Gemini モデルはバッチモードで 50% 割引で利用できます。
* Gemini 1.0 Pro は最大 32K のコンテキスト ウィンドウのみをサポートします。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディング: 費用を最適化するために動的取得を使用している場合、レスポンスにウェブからのグラウンディング サポート URL が 1 つ以上含まれているリクエストに対してのみ、Google 検索によるグラウンディングの料金が発生します。Gemini の費用は常に発生します。

Imagen

Vertex AI の Imagen を使用すると、テキスト プロンプトを送信することで、新しい画像の生成や画像の編集をしたり、またマスク領域を定義して画像の一部を編集したりできます。この他にも多くの機能を利用できます。

モデル 機能 説明 入力 出力 料金
Imagen 3 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.04
Imagen 3 Fast 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.02
Imagen 2、Imagen 画像の生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.020
画像編集 マスクなしまたはマスクを使用して画像を編集する 画像 / テキスト プロンプト 画像 画像 1 枚あたり $0.020
アップスケーリング 生成された画像の解像度を 2K と 4K に上げる 画像 画像 画像 1 枚あたり $0.003
ファインチューニング ユーザーが提供した「テーマ」を Imagen のプロンプトとして使用できるようにする(few shot training) テキスト識別子と 4-8 枚の画像を含めたテーマ ファイン チューニングされたモデル(ユーザーが提供したテーマでのトレーニング後) 1 ノード時間あたりの $(Vertex AI カスタム トレーニング料金)
画像キャプション 画像に短い / 長いテキスト キャプションを生成 画像 テキスト キャプション $0.0015 / 画像
Visual Q&A 画像に関連した質問に対し回答を提供 画像 / テキスト プロンプト テキスト回答 $0.0015 / 画像

料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

埋め込み

モデル 機能 説明 入力 出力 料金
multimodal エンベディング マルチモーダルのエンベディング: テキスト テキストを入力としてエンベディングを生成 テキスト エンベディング $0.0002 / 入力 1,000 文字
マルチモーダルのエンベディング: 画像 画像を入力としてエンベディングを生成 画像 エンベディング $0.0001 / 画像入力
マルチモーダルのエンベディング: 動画プラス 動画プラス 動画 エンベディング(動画 1 分あたり最大 15 個のエンベディング) 動画の 1 秒あたり $0.0020
マルチモーダルのエンベディング: 動画標準 動画 標準 動画 エンベディング(動画 1 分あたり最大 8 個のエンベディング) 動画 1 秒あたり $0.0010
マルチモーダルのエンベディング: 動画の基本 動画の基本 動画 エンベディング(動画 1 分あたり最大 4 個のエンベディング) 動画 1 秒あたり $0.0005
モデル リージョン 1,000 文字あたりの料金
テキスト用エンベディング 入力 グローバル
  • オンライン リクエスト: $0.000025
  • バッチ リクエスト: $0.00002
出力 グローバル
  • オンライン リクエスト: 無料
  • バッチ リクエスト: 無料

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

コード補完

Vertex AI における生成 AI の利用では、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後に、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。

モデル リージョン 1,000 文字あたりの料金
コード補完用 Codey 入力 グローバル
  • オンライン リクエスト: $0.00025
出力 グローバル
  • オンライン リクエスト: $0.0005

料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

翻訳(テキスト)

Vertex AI API と翻訳 LLM を使用してテキストを翻訳します。LLM 翻訳は、従来の翻訳モデルよりも流暢で人間らしい表現になりやすい傾向がありますが、サポートされる言語は限られています(詳細はこちら)

モデル メソッド 用途 100 万文字あたりの料金
LLM テキスト 翻訳プレビュー* 1 か月あたりの入力文字数

$10/1,000,000 文字*

1 か月あたりの出力文字数

$10/1,000,000 文字*

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
*料金はモデルで処理された文字数に基づきます。文字のカウントについての詳細は、課金対象の文字をご覧ください。

コンテキスト キャッシュ保存

コンテキスト キャッシュ保存を使用すると、Gemini モデルに入力テキストまたはメディアのコンテキスト部分をキャッシュ保存することで、Gemini 入力トークン処理の費用を 75% 削減し、コンテンツ生成のレイテンシを短縮できます。データがキャッシュに保存される期間(ユーザーが制御可能)によって、「Context Cache Storage」の料金が決まります。キャッシュされたコンテキストを作成する場合、標準の入力トークン料金が請求されます。入力データのキャッシュ ヒットには、通常の入力料金ではなく、割引料金の「キャッシュ入力」が適用されます。ストレージと入力の両方のデータサイズは、Gemini の入力料金と同じ方法で計算されます。

モデル 機能 タイプ 料金(= 128K 未満の入力トークン) 価格(128K 以上の入力トークン)
Gemini 1.5 Flash キャッシュ入力 画像入力
動画入力
テキスト入力
音声入力
0.000005 / 画像
0.000005 / 秒
0.0000046875 / 1,000 文字
0.0000005 / 秒
0.00001 / 画像
0.00001 / 秒
0.000009375 / 1,000 文字
0.000001 / 秒
コンテキスト キャッシュの保存 画像入力
動画入力
テキスト入力
音声入力
0.000263 / 画像 / 時間
0.000263/ 秒 / 時間
0.00025 / 1,000 文字 / 時間
0.000025 / 秒 / 時間
Gemini 1.5 Pro キャッシュ入力 画像入力
動画入力
テキスト入力
音声入力
0.0000821875 / 画像
0.0000821875 / 秒
0.000078125 / 1,000 文字
0.0000078125 / 秒
0.000164375 / 画像
0.000164375 / 秒
0.00015625 / 1,000 文字
0.000015625 / 秒
コンテキスト キャッシュの保存 画像入力
動画入力
テキスト入力
音声入力
0.0011835 / 画像 / 時間
0.0011835/ 秒 / 時間
0.001125 / 1,000 文字 / 時間
0.0001125 / 秒 / 時間

料金は米ドル(USD)で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

キャッシュされた費用の計算例

ユーザーが TTL 2 時間の 250,000 文字のキャッシュ コンテキストを作成し、その後 2 時間の間に Gemini 1.5 Pro モデルに 20 個の別々のリクエストを送信し、各リクエストがキャッシュ コンテキストに 200 文字のクエリを追加し、400 文字の出力を持つ場合、合計料金は次のように計算されます。

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

料金計算の例

ユーザーが PaLM Text Bison モデルに 5 つの別々のリクエストを送信し、それぞれのリクエストが入力 200 文字と出力 400 文字の場合、合計の料金は以下のように計算されます。

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

パートナーのモデル

パートナー モデルは、Google パートナーが開発した生成 AI モデルの厳選されたリストです。パートナー モデルは、マネージド API として提供されます。詳細については、パートナー モデルの概要をご覧ください。以下のセクションでは、Google パートナー モデルの料金の詳細を記載しています。

AI21 Labs のモデル

モデル 料金
Jamba 1.5 Large 入力: 100 万トークンあたり $2
出力: 100 万トークンあたり $8
Jamba 1.5 Mini 入力: 100 万トークンあたり $0.20
出力: 100 万トークンあたり $0.40

Anthropic の Claude モデル

モデル 料金
Claude 3.5 Haiku 入力: 100 万トークンあたり $1.00
出力: 100 万トークンあたり $5.00
Claude 3.5 Sonnet v2 入力: 100 万トークンあたり $3
出力: 100 万トークンあたり $15
Claude 3.5 Sonnet 入力: 100 万トークンあたり $3
出力: 100 万トークンあたり $15
Claude 3 Haiku 入力: 100 万トークンあたり $0.25
出力: 100 万トークンあたり $1.25
Claude 3 Sonnet 入力: 100 万トークンあたり $3
出力: 100 万トークンあたり $15
Claude 3 Opus 入力: 100 万トークンあたり $15
出力: 100 万トークンあたり $75

Meta の Llama モデル

モデル 料金
Llama 3.1 405B 入力: 100 万トークンあたり $5.00
出力: 100 万トークンあたり $16.00

Mistral AI のモデル

モデル 料金
Mistral Large(24.11) 入力: 100 万トークンあたり $2.00
出力: 100 万トークンあたり $6.00
Mistral Large(24.07) 入力: 100 万トークンあたり $2.00
出力: 100 万トークンあたり $6.00
Mistral Nemo 入力: $0.15 / 100 万トークン
出力: $0.15 / 100 万トークン
Codestral(24.05) 入力: 100 万トークンあたり $0.20
出力: 100 万トークンあたり $0.60

カスタム見積もりをリクエストする

Google Cloud の従量課金制では、使用したサービスに対してのみ料金が発生します。カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。
お問い合わせ