Vertex AI での AI モデルの構築とデプロイにかかる費用

料金は米ドル(USD)で表しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

200 レスポンス コードが返されるリクエストに対してのみ課金されます。4xx や 5xx などの他のレスポンス コードを返すリクエストは、入力または出力に対して課金されません。

このページでは、Vertex AI での生成 AI の料金について説明します。ML Platform や MLOps サービスなど、Vertex AI のその他の料金については、Vertex AI の料金ページをご覧ください。

Google モデル

Gemini 2.5

モデル タイプ 料金(100 万トークンあたり)<= 20 万入力トークン 価格(100 万トークンあたり)> 20 万入力トークン 料金(100 万トークンあたり)<= 20 万入力トークン(バッチ API を使用) 価格(100 万トークンあたり)> バッチ API で 20 万入力トークン
Gemini 2.5 Pro
入力(テキスト、画像、動画、音声) $1.25 $2.50 $0.625 $1.25
テキスト出力(回答と推論) $10 $15 $5 7.5 ドル


Gemini 2.5
Flash GA
入力(テキスト、画像、動画) $0.30 $0.30 $0.15 $0.15
オーディオ入力 $1 $1 $0.5 $0.5
テキスト出力 $2.50 $2.50 $1.25 $1.25
100 万トレーニング トークン向けのチューニング $5.00 なし なし なし




Gemini 2.5 Flash プレビュー
(エンドポイントは 2025 年 7 月 15 日に終了)
入力(テキスト、画像、動画) $0.15 $0.15 $0.075 $0.075
オーディオ入力 $1 $1 $0.5 $0.5
テキスト出力(思考なし) $0.60 $0.60 $0.30 $0.30
テキスト出力(思考 - 回答と推論) $3.50 $3.50 $1.75 $1.75




Gemini 2.5 Flash Live API
100 万入力テキストトークン $0.5 $0.5 なし なし
100 万入力音声トークン $3 $3 なし なし
100 万個の入力動画トークン $3 $3 なし なし
100 万個の出力テキスト トークン $2 $2 なし なし
100 万個の出力音声トークン $12 $12 なし なし



Gemini 2.5 Flash Lite
入力(テキスト、画像、動画) $0.1 $0.1 なし なし
オーディオ入力 $0.5 $0.5 なし なし
テキスト出力(回答と推論) 0.4 ドル 0.4 ドル なし なし


Google 検索によるグラウンディング
Gemini 2.0 Flash2.5 Flash2.5 Flash-Lite には、1 日あたり合計 1,500 個の根拠のあるプロンプトが追加料金なしで含まれています。Gemini 2.5 Pro では、1 日あたり 10,000 個の根拠のあるプロンプトを追加料金なしで利用できます。

Grounded プロンプトの上限を超えた場合は、Grounded プロンプト 1,000 件あたり
$35 の料金が発生します。

Grounded プロンプトは、Gemini に送信され、Google 検索に 1 つ以上のクエリを送信するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。

1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。

エンタープライズ向けウェブ グラウンディング
1,000 個の根拠のあるプロンプトあたり$45。グラウンディング プロンプトは、Gemini に送信され、Web Grounding for Enterprise** に 1 つ以上のクエリを実行するリクエストです。複数の検索クエリが Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。

1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、アカウント チームにお問い合わせください。
データに基づくグラウンディング 2025 年 6 月 16 日より、リクエスト 1,000 件あたり $2.5 の料金が発生します。

* クエリ入力コンテキストが 20 万トークンを超える場合、すべてのトークン(入力と出力)が長いコンテキストの料金で課金されます。
** Google 検索によるグラウンディングとエンタープライズ向けウェブ グラウンディングは、プロンプトがウェブ結果(ウェブから 1 つ以上のグラウンディング サポート URL を含む結果)を正常に返した場合にのみ課金されます。Gemini モデルの使用料は別途適用されます。

Gemini 2.0

Gemini 2.0 はトークンに基づいて課金されます。リクエストを送信する前にリクエスト内の入力トークンの数を計算するには、SDK トークン化ツールまたは countTokens API を使用できます。リクエストが 400 または 500 エラーで失敗した場合、使用したトークンに対して料金は発生しません。

料金表の切り替えを使用して、トークンベースの料金とモダリティベースの料金を比較します。

トークンベースの料金

モデル タイプ 料金 バッチ API の料金




Gemini 2.0 Flash
100 万入力トークン $0.15 $0.075
100 万入力音声トークン $1.00 $0.50
100 万の出力テキスト トークン $0.60 $0.30
100 万トレーニング トークン向けのチューニング $3.00




Gemini 2.0 Flash 画像生成
100 万入力トークン $0.15
100 万入力音声トークン $1.00
100 万個の入力動画トークン $3
100 万個の出力テキスト トークン $0.60
100 万個の出力画像トークン $30.00




Gemini 2.0 Flash Live API
100 万入力テキストトークン $0.5
100 万入力音声トークン $3
100 万個の入力動画トークン $3
100 万個の出力テキスト トークン $2
100 万個の出力音声トークン $12




Gemini 2.0 Flash Lite
100 万入力トークン $0.075 $0.0375
100 万入力音声トークン $0.075 $0.0375
100 万の出力テキスト トークン $0.30 $0.15
100 万トレーニング トークン向けのチューニング $1.00


Google 検索によるグラウンディング
Gemini 2.0 Flash2.5 Flash には、1 日あたり合計 1,500 個の根拠のあるプロンプトが追加料金なしで含まれています。

上記の制限を超える Grounded プロンプトは、1,000 個あたり
$35 の料金が発生します。

グラウンディング プロンプトは、Gemini に送信され、Google 検索* に 1 つ以上のクエリを実行するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。

1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。

エンタープライズ向けウェブ グラウンディング
1,000 個の根拠のあるプロンプトあたり$45。グラウンディング プロンプトは、Gemini に送信されるリクエストで、Web Grounding for Enterprise* に 1 つ以上のクエリを送信します。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。

1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。
データに基づくグラウンディング 2025 年 6 月 16 日より、リクエスト 1,000 件あたり $2.5 の料金が発生します。

モダリティベースの料金

以下のモダリティの料金は、平均的なユースケースに基づいており、参考情報としてのみ提供されています。実際の課金はトークンに基づいてのみ行われます。

  • 4 文字は、空白文字を含めて約 1 つのテキスト トークンになります。
  • 1024×1024 ピクセルの画像の場合、1, 290 個のトークンが消費されます。画像ごとのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
  • 動画入力は、1 秒あたり 1 フレームのサンプリング レートで、1 秒あたり 258 個のトークンを消費します。動画と音声の組み合わせでは、動画トークンと音声トークンの両方に対して課金されます。
  • 音声入力は、タイムスタンプなしで 1 秒あたり 25 個のトークンを消費します。
モデル タイプ 料金 バッチ API の料金




Gemini 2.0 Flash
テキストを入力(1 文字あたりの単価/100 万文字) $0.0375 $0.01875
入力画像($/画像) $0.0001935 $0.00009675
入力動画($/秒) $0.0000387 $0.00001935
入力音声($/秒) $0.000025 $0.0000125
出力テキスト(100 万文字あたりの料金) $0.15 $0.075




Gemini 2.0 Flash 画像生成
テキストを入力(1 文字あたりの単価/100 万文字) $0.0375
入力画像($/画像) $0.0001935
入力動画($/秒) $0.0000387
入力音声($/秒) $0.000025
出力テキスト(100 万文字あたりの料金) $0.15
出力画像(画像)(1 画像あたりの料金) $0.04





Gemini 2.0 Flash Lite
テキストを入力(1 文字あたりの単価/100 万文字) $0.01875 $0.009375
入力画像($/画像) $0.00009675 $0.000048375
入力動画($/秒) $0.00001935 $0.000009675
入力音声($/秒) $0.000001875 $0.000000938
出力テキスト(100 万文字あたりの料金) $0.075 $0.0375


Google 検索によるグラウンディング
Gemini 2.0 Flash2.5 Flash には、1 日あたり合計 1,500 個の根拠のあるプロンプトが追加料金なしで含まれています。

上記の制限を超える Grounded プロンプトは、1,000 個あたり
$35 の料金が発生します。

グラウンディング プロンプトは、Gemini に送信され、Google 検索* に 1 つ以上のクエリを実行するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。

1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。

エンタープライズ向けウェブ グラウンディング
1,000 個の根拠のあるプロンプトあたり$45。グラウンディング プロンプトは、Gemini に送信されるリクエストで、Web Grounding for Enterprise* に 1 つ以上のクエリを送信します。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。

1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。

* 料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* トレーニング トークンの数は、トレーニング データセット内のトークンの合計数にエポック数を掛けて計算されます。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像に相当します。
* チューニング済みモデルのエンドポイントは、ベースモデルと同じ予測料金です。
* Google 検索によるグラウンディングとエンタープライズ向けウェブ グラウンディングは、プロンプトがウェブ結果(ウェブから 1 つ以上のグラウンディング サポート URL を含む結果)を正常に返した場合にのみ課金されます。Gemini モデルの使用料は別途適用されます。
* Gemini 2.0 Flash Live API: 音声(入力/出力)は 1 秒あたり 25 個のトークン、動画(入力)は 1 秒あたり 258 個のトークン。Gemini 2.0 Flash Live API がプレビュー版である間は、Google 検索によるグラウンディングは引き続き無料でご利用いただけます。

Vertex AI Model Optimizer の料金(試験運用版)*

Vertex AI Model Optimizer は、Gemini モデルのリクエストに単一のメタエンドポイントを提供することで、エンタープライズ カスタマーによる Gemini の使用を簡素化します。このサービスを利用するカスタマーは、Flash、Pro、または特定のバージョンを使用するかどうかを指定する必要はありません。代わりに、構成可能な設定(費用、品質、バランス)を指定することで、好みを示すことができます。Model Optimizer は、各クエリを最適なモデルに送信することで、タスクに適した適切なレベルのインテリジェンスを適用します。

Vertex AI Model Optimizer は動的な料金設定を適用します。つまり、トークンあたりの平均料金は、タスクを完了するために適用されるモデルのインテリジェンス レベルによって異なります。そのため、構成設定に基づく可能性のあるシナリオを説明するために、以下の料金例を用意しました(下の表を参照)。Model Optimizer SKU は $1 の SKU で、請求に適用される購入単位として機能します。モデルを使用した後も、従量課金制で請求されます。

I/O 比率 5:1 例 1
chat bot
注: これらの範囲は保証されるわけではなく、お客様ごとに結果が異なる場合があります
お客様の好み お客様の入力トークンが MO に送信される お客様の出力トークンが MO に送信される 100 万トークンあたりの平均入力価格(上限) 100 万トークンあたりの平均出力価格(上限) 100 万トークンあたりの平均入力価格(下限) 100 万トークンあたりの平均出力価格(下限)
費用 10,000,000 2,000,000 $0.63 $2.50 $0.16 $0.63
バランス 10,000,000 2,000,000 $1.26 $5.00 $0.63 $2.50
品質 10,000,000 2,000,000 1.89 ドル $7.50 $1.26 $5.00
I/O 比 1:20 例 2 コンテンツ生成
お客様の好み お客様の入力トークンが MO に送信される お客様の出力トークンが MO に送信される 100 万トークンあたりの平均入力価格(上限) 100 万トークンあたりの平均出力価格(上限) 100 万トークンあたりの平均入力価格(下限) 100 万トークンあたりの平均出力価格(下限)
費用 1,000,000 20,000,000 $0.63 $2.50 $0.16 $0.63
バランス 1,000,000 20,000,000 $1.26 $5.00 $0.63 $2.50
品質 1,000,000 20,000,000 1.89 ドル $7.50 $1.26 $5.00

* Model Optimizer は有料の試験運用版サービスであり、リクエストが Vertex 上の Gemini の試験運用版にルーティングされる場合があります。

その他の Gemini モデル

Gemini 2.0 以外のすべての Gemini モデルは、文字数、画像、動画/音声秒数などのモダリティに基づいて課金されます。テキスト入力は、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。その結果、トークンあたり約 4 文字になります。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後に、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。メディア入力は、画像ごと、または秒ごと(動画)に課金されます。リクエストが失敗して 400 または 500 エラーが発生した場合、使用したトークンに対して料金は発生しません。

モデル 機能 タイプ 料金
(= 128K 入力トークン以下)
価格
(128K 以上の入力トークン)
Gemini 1.5 Flash マルチモーダル 画像入力
動画入力
テキスト入力
音声入力
$0.00002 / 画像
$0.00002 / 秒
$0.00001875 / 1,000 文字
$0.000002 / 秒
$0.00004 / 画像
$0.00004 / 秒
$0.0000375 / 1,000 文字
$0.000004 / 秒
テキスト出力 $0.000075 / 1,000 文字 $0.00015 / 1,000 文字
チューニング* トレーニング トークン $8 / 100 万トークン
Gemini 1.5 Pro マルチモーダル 画像入力
動画入力
テキスト入力
音声入力
$0.00032875 / 画像
$0.00032875 / 秒
$0.0003125 / 1,000 文字
$0.00003125 / 秒
$0.0006575 / 画像
$0.0006575 / 秒
$0.000625 / 1,000 文字
$0.0000625 / 秒
テキスト出力 $0.00125 / 1,000 文字 $0.0025 / 1,000 文字
チューニング* トレーニング トークン $80 / 100 万トークン
Gemini 1.0 Pro マルチモーダル 画像入力
動画入力
テキスト入力
$0.0025 / 画像
$0.002 / 秒
$0.000125 / 1,000 文字
テキスト出力 $0.000375 / 1k 文字
Google 検索によるグラウンディング テキスト 1,000 個の根拠のあるプロンプトあたり$35

グラウンディング プロンプトは、Gemini に送信され、Google 検索* に 1 つ以上のクエリを実行するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。

1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様のアカウント担当者にお問い合わせください。
エンタープライズ向けウェブ グラウンディング テキスト 1,000 個の根拠のあるプロンプトあたり$45

グラウンディング プロンプトは、Gemini に送信され、Web Grounding for Enterprise* に 1 つ以上のクエリを実行するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。

1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様のアカウント担当者にお問い合わせください。
データに基づくグラウンディング テキスト 2025 年 6 月 16 日より、リクエスト 1,000 件あたり $2.5 の料金が発生します。

* 料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* クエリ コンテキストが 128K より長い場合、すべてのトークンが長いコンテキスト料金で課金されます。
* Gemini モデルは、バッチモードで 50% 割引で利用できます。
* Gemini 1.0 Pro は最大 32K のコンテキスト ウィンドウのみをサポートします。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像に相当します。
* チューニング済みモデルのエンドポイントは、ベースモデルと同じ予測料金です。
* Google 検索によるグラウンディングとエンタープライズ向けウェブ グラウンディングは、プロンプトがウェブ結果(ウェブから 1 つ以上のグラウンディング サポート URL を含む結果)を正常に返した場合にのみ課金されます。Gemini モデルの使用料は別途発生します。

Imagen

Vertex AI の Imagen を使用すると、テキスト プロンプトを送信することで、新しい画像の生成や画像の編集をしたり、またマスク領域を定義して画像の一部を編集したりできます。この他にも多くの機能を利用できます。

モデル 機能 説明 入力 出力 料金
Imagen 4 Ultra 画像生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.06
画像 4 画像生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.04
Imagen 4 Fast 画像生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.02
Imagen 3 画像生成 画像を生成
画像を編集
画像をカスタマイズ
テキスト プロンプト 画像 画像 1 枚あたり $0.04
Imagen 3 Fast 画像生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.02
Imagen 2、Imagen 画像生成 画像を生成する テキスト プロンプト 画像 画像 1 枚あたり $0.020
画像編集 マスクなしまたはマスクを使用して画像を編集する 画像 / テキスト プロンプト 画像 画像 1 枚あたり $0.020
アップスケーリング 生成された画像の解像度を 2K と 4K に上げる 画像 画像 画像 1 枚あたり $0.003
ファインチューニング ユーザーが提供した「テーマ」を Imagen のプロンプトとして使用できるようにする(few shot training) テキスト識別子と 4-8 枚の画像を含めたテーマ ファイン チューニングされたモデル(ユーザーが提供したテーマでのトレーニング後) 1 ノード時間あたりの $(Vertex AI カスタム トレーニング料金)
画像キャプション 画像に短い / 長いテキスト キャプションを生成 画像 テキスト キャプション $0.0015 / 画像
Visual Q&A 画像に関連した質問に対し回答を提供 画像 / テキスト プロンプト テキスト回答 $0.0015 / 画像

料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

Veo

Veo 2 は、現実世界の物理法則や人間の動作や表情のニュアンスに対する理解を深め、幅広いテーマやスタイルで非常に高品質な動画を作成します。

モデル 機能 説明 入力 出力 料金
Veo 3 動画生成 テキスト プロンプトまたは参照画像から動画を生成 テキスト/画像 プロンプト 動画 $0.50/秒
Veo 3 動画 + 音声生成 テキスト プロンプトまたは参照画像から、同期した音声/効果音付きの動画を生成する テキスト/画像 プロンプト 動画 + 音声 $0.75/秒
Veo 2 動画生成 テキスト プロンプトまたは参照画像から動画を生成 テキスト/画像 プロンプト 動画 $0.50/秒
Veo 2 高度な管理機能 開始フレームと終了フレームの補間によって動画を生成、生成した動画を拡張、カメラコントロールを適用 テキスト/画像/動画 プロンプト 動画 $0.50/秒

Lyria

Lyria 2 は、ニュアンスのある出力が鍵となる、洗練された作曲や詳細なクリエイティブな探求に最適な高品質の楽器音楽生成を提供します。

モデル 機能 説明 入力 出力 料金
Lyria 2 音楽生成 テキスト プロンプトから音楽を生成する テキスト プロンプト 音楽 30 秒あたり $0.06

AI アプリケーションのエンベディング費用を把握する

モデル リージョン 1,000 個の入力トークンあたりの料金
Gemini の埋め込み 入力 グローバル
  • オンライン リクエスト: $0.00015
  • バッチ リクエスト: $0.00012
出力 グローバル
  • オンライン リクエスト: 無料
  • バッチ リクエスト: 無料
モデル リージョン 1,000 文字あたりの料金
テキストのエンベディング
(Gemini エンベディングを除く)
入力 グローバル
  • オンライン リクエスト: $0.000025
  • バッチ リクエスト: $0.00002
出力 グローバル
  • オンライン リクエスト: 無料
  • バッチ リクエスト: 無料
モデル 機能 説明 入力 出力 料金
multimodal エンベディング マルチモーダルのエンベディング: テキスト テキストを入力としてエンベディングを生成 テキスト エンベディング $0.0002 / 入力 1,000 文字
マルチモーダルのエンベディング: 画像 画像を入力としてエンベディングを生成 画像 エンベディング $0.0001 / 画像入力
マルチモーダルのエンベディング: 動画プラス Video Plus 動画 エンベディング(動画 1 分あたり最大 15 個のエンベディング) 動画の 1 秒あたり $0.0020
マルチモーダルのエンベディング: 動画標準 動画 標準 動画 エンベディング(動画 1 分あたり最大 8 エンベディング) 動画 1 秒あたり $0.0010
マルチモーダルのエンベディング: 動画の基本 動画の基本 動画 エンベディング(動画 1 分あたり最大 4 エンベディング) 動画 1 秒あたり $0.0005

料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

Vertex AI のコード補完の料金

Vertex AI における生成 AI の利用では、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後に、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。

モデル リージョン 1,000 文字あたりの料金
コード補完用 Codey 入力 グローバル
  • オンライン リクエスト: $0.00025
出力 グローバル
  • オンライン リクエスト: $0.0005

料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

翻訳(テキスト)

Vertex AI API と翻訳 LLM を使用してテキストを翻訳します。LLM 翻訳は、従来の翻訳モデルよりも流暢で人間らしい表現になりやすい傾向がありますが、サポートされている言語は限られています(詳細はこちら)

モデル メソッド 用途 100 万文字あたりの料金
LLM テキスト翻訳* 1 か月あたりの入力文字数

$10/100 万文字*

1 か月あたりの出力文字数

$10/1,000,000 文字*

料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
*料金はモデルで処理された文字数に基づきます。文字のカウントについての詳細は、課金対象の文字をご覧ください。

Vertex AI のコンテキスト キャッシュを使用して費用を最適化する

コンテキスト キャッシュ保存を使用すると、入力テキストまたはメディアのコンテキスト部分を Gemini モデルにキャッシュ保存することで、Gemini 入力トークン処理の費用を 75% 削減し、コンテンツ生成のレイテンシを短縮できます。データがキャッシュに保存される期間(ユーザーが制御可能)によって、「Context Cache Storage」の料金が決まります。キャッシュされたコンテキストを作成する場合、標準の入力トークン料金が請求されます。入力データのキャッシュ ヒットには、通常の入力料金ではなく、割引料金の「キャッシュ入力」が適用されます。ストレージと入力の両方のデータサイズは、Gemini の入力料金と同じ方法で計算されます。

Gemini 2.5 モデル

モデル 機能 タイプ 料金(100 万トークンあたり)
<= 20 万入力トークン
料金(100 万トークンあたり)
> 20 万入力トークン
Gemini 2.5 Pro キャッシュ入力 入力(テキスト、画像、動画、音声) $0.31(100 万トークンあたり) $0.625(100 万トークンあたり)
出力 なし なし
コンテキスト キャッシュのストレージ 入力(テキスト、画像、動画、音声) $4.5(/M Tok/時間) $4.5(/M Tok/時間)
Gemini 2.5 Flash キャッシュ入力 入力(テキスト、画像、動画、音声) $0.0375(/1M トークン) $0.0375(/1M トークン)
出力 なし なし
コンテキスト キャッシュのストレージ 入力(テキスト、画像、動画、音声) $1(/M Tok/時間) $1(/M Tok/時間)

Gemini 2.0 モデル

トークンベースの料金


モデル

タイプ
ストレージ
(M 時間)
料金




Gemini 2.0 Flash
100 万入力トークン $1.00 $0.0375
100 万入力音声トークン $1.00 $0.25
100 万の出力テキスト トークン なし なし


Gemini 2.0 Flash Lite
100 万入力トークン $1.00 $0.01875
100 万入力音声トークン $1.00 $0.01875
100 万の出力テキスト トークン なし なし

モダリティベースの料金

以下のモダリティの料金は、平均的なユースケースに基づいており、参考情報としてのみ提供されています。実際の課金はトークンに基づいてのみ行われます。

  • 4 文字は、空白文字を含めて約 1 つのテキスト トークンになります。
  • 1024×1024 ピクセルの画像の場合、1, 290 個のトークンが消費されます。画像ごとのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
  • 動画入力は、1 秒あたり 1 フレームのサンプリング レートで、1 秒あたり 258 個のトークンを消費します。動画と音声の組み合わせでは、動画トークンと音声トークンの両方に対して課金されます。
  • 音声入力は、タイムスタンプなしで 1 秒あたり 25 個のトークンを消費します。

モデル

タイプ
ストレージ
(モダリティ時間)

料金




Gemini 2.0 Flash
テキストを入力(1 文字あたりの単価/100 万文字) $0.25 $0.009375
入力画像($/画像) $0.00129 ~ $0.000048375
入力動画($/秒) $0.000258 $0.000009675
入力音声($/秒) $0.000025 $0.00000625
出力テキスト(100 万文字あたりの料金) なし なし




Gemini 2.0 Flash Lite
テキストを入力(1 文字あたりの単価/100 万文字) $0.25 $0.0046875
入力画像($/画像) $0.00129 ~ $0.0000241875
入力動画($/秒) $0.000258 $0.000009675
入力音声($/秒) $0.000258 $0.0000048375
出力テキスト(100 万文字あたりの料金) なし なし


Google 検索によるグラウンディング
Gemini 2.0 Flash では、1 日あたり最大 1,500 件の地上リクエストを追加料金なしで利用できます。1 日あたり 1,500 件を超える Grounded リクエスト
は、リクエスト 1,000 件あたり 35 ドルで課金されます(1 日あたり最大 100 万件のリクエスト)。

1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウント担当者にお問い合わせください。

エンタープライズ向けウェブ グラウンディング
2025 年 5 月 5 日より、リクエスト 1,000 件あたり $45(1 日あたり最大 100 万件のリクエスト)

1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウント担当者にお問い合わせください。

* 料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像に相当します。
* チューニング済みモデルのエンドポイントは、ベースモデルと同じ予測料金です。
* Google 検索によるグラウンディングは、ウェブから 1 つ以上のグラウンディング サポート URL を含む結果が返されたリクエストに対してのみ課金されます。通常の Gemini モデル使用料も適用されます。

プロビジョニングされたスループット

プロビジョンド スループットは、生成 AI のニーズに応じたスループットを保証し、生成 AI スケール ユニット(GSU)を介してトランザクションが行われます。各 GSU が提供するスループットについて詳しくはこちら を、オンライン見積もりツールについてはこちらをご覧ください。

期間 GSU あたりの料金 1 回あたり
1 週間契約 1,200 ドル 1 週間
1 か月契約 2,700 ドル
3 か月契約 $2,400
1 年契約 $2,000

料金計算の例

ユーザーは、1,000 個のテキスト トークンと 500 個のオーディオ トークンの入力で 1 秒あたり 10 件のクエリ(QPS)をサポートし、gemini-2.0-flash を使用して 300 個のテキスト トークンの出力を受け取る必要があります。

スループットとバーンダウン率のから、gemini-2.0-flash では、入力テキスト トークンのバーンダウン率は 1 トークン、入力音声トークンのバーンダウン率は 7 トークン、出力テキスト トークンのバーンダウン率は 4 トークンであることがわかります。

ユーザーの入力トークンの合計は、1,000*(入力テキスト トークンあたり 1 トークン)+ 500*(入力音声トークンあたり 7 トークン)= 4,500 のバーンドゥ 調整入力トークンです。ユーザーの出力トークンの合計は、300 ×(出力テキストトークンあたり 4 トークン)= 1,200 バーンダウン調整済み出力トークンです。合計すると、4,500 個のバーンダウン調整済み入力トークン + 1,200 個のバーンダウン調整済み出力トークン = クエリあたり合計 5,700 個のトークンとなります。

クエリあたりの合計トークン数に QPS を掛けると、クエリあたりの合計トークン数 5,700 個 × QPS 10 = 1 秒あたりの合計トークン数 57,000 個となります。

これを GSU あたりの 1 秒あたりの合計スループットで割ると、1 秒あたりの合計トークン数 57,000 ÷ GSU あたりの 1 秒あたりのスループット 3,360 = 16.96 GSU となります。このモデルの最小 GSU 購入単位は 1 なので、ユーザーは 17 個の GSU が必要になります。

このスループットを 1 週間維持する場合、1,200 ドル × 17 GSU = 1 週間あたり 20,400 ドルの費用がかかります。このスループットを 1 か月間維持する場合、$2,700 × 17 GSU = 1 か月あたり $45,900 の費用がかかります。このスループットを 3 か月間維持する場合、費用は $2,400 × 17 GSU = 月額 $40,800 になります。最後に、このスループットを 1 年間維持する場合、1 か月あたり $2,000 × 17 GSU = $34,000 の費用がかかります。

Vertex AI のパートナー モデルの料金の比較

パートナー モデルは、Google パートナーが開発した生成 AI モデルの厳選されたリストです。パートナー モデルは、マネージド API として提供されます。詳細については、パートナー モデルの概要をご覧ください。以下のセクションでは、Google パートナー モデルの料金の詳細を記載しています。

AI21 Labs のモデル

モデル 料金
Jamba 1.5 Large 入力: 100 万トークンあたり $2
出力: 100 万トークンあたり $8
Jamba 1.5 Mini 入力: 100 万トークンあたり $0.20
出力: 100 万トークンあたり $0.40

Anthropic の Claude モデル

モデル 料金
Claude Opus 4 入力: 100 万トークンあたり $15
出力: 100 万トークンあたり $75

バッチ入力: 100 万トークンあたり $7.50
バッチ出力: 100 万トークンあたり $37.50

キャッシュ書き込み: 100 万トークンあたり $18.75
キャッシュヒット: 100 万トークンあたり $1.50

バッチキャッシュ書き込み: 100 万トークンあたり $9.375
バッチキャッシュヒット: 100 万トークンあたり $0.75
Claude Sonnet 4 入力: 100 万トークンあたり $3
出力: 100 万トークンあたり $15

バッチ入力: 100 万トークンあたり $1.50
バッチ出力: 100 万トークンあたり $7.50

キャッシュ書き込み: 100 万トークンあたり $3.75
キャッシュヒット: 100 万トークンあたり $0.30

バッチキャッシュ書き込み: 100 万トークンあたり $1.875
バッチキャッシュヒット: 100 万トークンあたり $0.15
Claude 3.7 Sonnet 入力: 100 万トークンあたり $3
出力: 100 万トークンあたり $15

バッチ入力: 100 万トークンあたり $1.50
バッチ出力: 100 万トークンあたり $7.50

キャッシュ書き込み: 100 万トークンあたり $3.75
キャッシュヒット: 100 万トークンあたり $0.30

バッチキャッシュ書き込み: 100 万トークンあたり $1.875
バッチキャッシュヒット: 100 万トークンあたり $0.15
Claude 3.5 Haiku 入力: 100 万トークンあたり $0.80
出力: 100 万トークンあたり $4

バッチ入力: 100 万トークンあたり $0.40
バッチ出力: 100 万トークンあたり $2

キャッシュ書き込み: 100 万トークンあたり $1
キャッシュヒット: 100 万トークンあたり $0.08

バッチキャッシュ書き込み: 100 万トークンあたり $0.50
バッチキャッシュヒット: 100 万トークンあたり $0.04
Claude 3.5 Sonnet v2 入力: 100 万トークンあたり $3
出力: 100 万トークンあたり $15

バッチ入力: 100 万トークンあたり $1.50
バッチ出力: 100 万トークンあたり $7.50

キャッシュ書き込み: 100 万トークンあたり $3.75
キャッシュヒット: 100 万トークンあたり $0.30

バッチキャッシュ書き込み: 100 万トークンあたり $1.875
バッチキャッシュヒット: 100 万トークンあたり $0.15
Claude 3.5 Sonnet 入力: 100 万トークンあたり $3
出力: 100 万トークンあたり $15

キャッシュ書き込み: 100 万トークンあたり $3.75
キャッシュヒット: 100 万トークンあたり $0.30
Claude 3 Haiku 入力: 100 万トークンあたり $0.25
出力: 100 万トークンあたり $1.25

キャッシュ書き込み: 100 万トークンあたり $0.30
キャッシュヒット: 100 万トークンあたり $0.03
Claude 3 Sonnet (deprecated) 入力: 100 万トークンあたり $3
出力: 100 万トークンあたり $15
Claude 3 Opus 入力: 100 万トークンあたり $15
出力: 100 万トークンあたり $75

キャッシュ書き込み: 100 万トークンあたり $18.75
キャッシュヒット: 100 万トークンあたり $1.50

Meta の Llama モデル

モデル 料金
Llama 3.1 405B 入力: 100 万トークンあたり $5.00
出力: 100 万トークンあたり $16.00
Llama 3.3 70B * 入力: 100 万トークンあたり $0.72
出力: 100 万トークンあたり $0.72
Llama 4 Scout * 入力: 100 万トークンあたり $0.25
出力: 100 万トークンあたり $0.70
Llama 4 Maverick * 入力: 100 万トークンあたり $0.35
出力: 100 万トークンあたり $1.15
  • 2025 年 5 月 1 日まで無料視聴可能。

Mistral AI のモデル

モデル 料金
Mistral OCR(25.05) 入力: 100 万トークンあたり $0.0005(または 1 ページあたり $0.0005)
出力: 100 万トークンあたり $0.0005(または 1 ページあたり $0.0005)
Mistral Small 3.1(25.03) 入力: 100 万トークンあたり $0.10
出力: 100 万トークンあたり $0.30
Mistral Large(24.11) 入力: 100 万トークンあたり $2.00
出力: 100 万トークンあたり $6.00
Mistral Nemo 入力: 100 万トークンあたり $0.15
出力: 100 万トークンあたり $0.15
Codestral(25.01) 入力: 100 万トークンあたり $0.30
出力: 100 万トークンあたり $0.90

カスタム見積もりをリクエストする

Google Cloud の従量課金制では、使用したサービスに対してのみ料金が発生します。カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。
お問い合わせ