Vertex AI での AI モデルの構築とデプロイの費用

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

課金されるのは、200 レスポンスコードを返すリクエストのみです。4xx や 5xx などの他のレスポンスコードを返すリクエストでは、入力や出力に対して料金は発生しません。

このページでは、Vertex AI での生成 AI の料金について説明します。ML Platform や MLOps サービスなど、Vertex AI のその他の料金については、Vertex AI の料金ページをご覧ください。

Google モデル

Gemini 3

モデル	タイプ	料金（100 万トークンあたり）<= 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン	料金（100 万トークンあたり）<= 20 万個のキャッシュ入力トークン	料金（100 万トークンあたり）> 200,000 個のキャッシュ入力トークン	料金（100 万トークンあたり）<= バッチ API で 20 万入力トークン	料金（100 万トークンあたり）> バッチ API で 20 万入力トークン
Gemini 3 Pro のプレビュー
	入力（テキスト、画像、動画、音声）	$2	$4	$0.2	$0.4	$1	$2
	テキスト出力（回答と推論）	$12	$18	なし	なし	$6	$9
	画像出力**	$120	なし	なし	なし	$60	なし
Gemini 3 Flash プレビュー
	入力（テキスト、画像、動画）	$0.5	$0.5	$0.05	$0.05	$0.25	$0.25
	入力（音声）	$1	$1	$0.1	$0.1	$0.5	$0.5
	テキスト出力（回答と推論）	$3	$3	なし	なし	$1.5	$1.5
Google 検索によるグラウンディングとエンタープライズ向けウェブグラウンディング	すべての Gemini 3 モデルで集計され、1 か月あたり 5,000 件の検索クエリが無料で含まれます。これらの上限を超える検索クエリは、1,000 件あたり$14 で課金されます。お客様が Gemini に送信したリクエストにより、Google 検索（または Enterprise のウェブグラウンディング）に対する 1 つ以上のクエリが生成されることがあります。検索クエリが実行されるたびに料金が発生します。課金は 2026 年 1 月 5 日に開始されます。 Google 検索を使用したグラウンディングまたはエンタープライズ向けウェブグラウンディングによって提供される入力トークンは課金対象外です。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウントチームにお問い合わせください。
Google マップによるグラウンディング	すべての Gemini 3 モデルで集計され、1 か月あたり 5,000 件の検索クエリが無料で含まれます。これらの上限を超える Maps クエリは、1,000 クエリあたり$14 で課金されます。お客様が Gemini にリクエストを送信すると、Google マップに対して 1 つ以上のクエリが実行されることがあります。実行された個々のクエリごとに課金されます。課金は 2026 年 1 月 5 日から開始 Google Maps から提供される入力トークンは課金対象外です。
データによるグラウンディング	プロンプト 1,000 件あたり $2.50。

* クエリ入力コンテキストが 200, 000 トークンを超える場合、すべてのトークン（入力と出力）に長いコンテキストの料金が適用されます。
** 1K（1024x1024）および 2K（2048x2048）の出力画像は、1, 120 の画像出力トークンを消費します。これは、生成された画像 1 枚あたり 0.134 ドルに相当します。4K（4096x4096）画像は 2, 000 個の画像出力トークンを消費し、これは生成された画像 1 枚あたり 0.24 ドルに相当します。

Gemini 2.5

モデル	タイプ	料金（100 万トークンあたり）<= 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン	料金（100 万トークンあたり）<= 20 万個のキャッシュ入力トークン	料金（100 万トークンあたり）> 200,000 個のキャッシュ入力トークン	料金（100 万トークンあたり）<= バッチ API で 20 万入力トークン	料金（100 万トークンあたり）> バッチ API で 20 万入力トークン
Gemini 2.5 Pro
	入力（テキスト、画像、動画、音声）	$1.25	2.5 ドル	$0.125	$0.250	$0.625	$1.25
	テキスト出力（回答と推論）	$10	$15	なし	なし	$5	$7.5
Gemini 2.5 Pro コンピュータの使用 - プレビュー
	入力（テキスト、画像、動画、音声）	$1.25	2.5 ドル	なし	なし	なし	なし
	テキスト出力（回答と推論）	$10.00	$15.00	なし	なし	なし	なし
Gemini 2.5 Flash
	入力（テキスト、画像、動画）	$0.30	$0.30	$0.030	$0.030	$0.15	$0.15
	オーディオ入力	$1	$1	$0.100	$0.100	$0.5	$0.5
	テキスト出力（回答と推論）	$2.50	$2.50	なし	なし	$1.25	$1.25
	画像出力***	$30	$30	なし	なし	$15	$15
Gemini 2.5 Flash Live API
	100 万個の入力テキストトークン	$0.5	$0.5	なし	なし	なし	なし
	100 万個の入力音声トークン	$3	$3	なし	なし	なし	なし
	100 万個の入力動画/画像トークン	$3	$3	なし	なし	なし	なし
	100 万個の出力テキストトークン	$2	$2	なし	なし	なし	なし
	100 万個の出力音声トークン	$12	$12	なし	なし	なし	なし
Gemini 2.5 Flash Lite
	入力（テキスト、画像、動画）	$0.1	$0.1	$0.010	$0.010	$0.05	$0.05
	オーディオ入力	$0.3	$0.3	$0.030	$0.030	$0.15	$0.15
	テキスト出力（回答と推論）	$0.4	$0.4	なし	なし	$0.2	$0.2
Google 検索によるグラウンディング	Gemini 2.0 Flash、2.5 Flash、2.5 Flash-Lite には、1 日あたり 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。Gemini 2.5 Pro には、1 日あたり 10,000 件のグラウンディングされたプロンプトが追加料金なしで含まれています。これらの上限を超えるグラウンディングされたプロンプトは、グラウンディングされたプロンプト 1,000 件あたり 35 ドルで課金されます。グラウンディングされたプロンプトとは、Google 検索に対して 1 つ以上のクエリを行う Gemini に送信されたリクエストです&ast;&ast;。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングプロンプトが必要な場合は、アカウントチームにお問い合わせください。
エンタープライズ向けウェブグラウンディング	1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブグラウンディングに対して 1 つ以上のクエリを実行します**。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングプロンプトが必要な場合は、アカウントチームにお問い合わせください。
データによるグラウンディング	1,000 リクエストあたり $2.5。
Google マップによるグラウンディング	1,000 件のグラウンディングされたプロンプトあたり$25。グラウンディングされたプロンプトとは、Google マップに少なくとも 1 回クエリを行うよう Gemini に送信するリクエストです。

* クエリ入力コンテキストが 200, 000 トークンを超える場合、すべてのトークン（入力と出力）に長いコンテキストの料金が適用されます。
** Google 検索によるグラウンディングと企業向けウェブグラウンディングは、プロンプトがウェブの結果を正常に返した場合（つまり、ウェブからのグラウンディングサポート URL を 1 つ以上含む結果）にのみ課金されます。Gemini モデルの使用料金は別途適用されます。
*** 1024x1024 の画像は 1290 トークンを消費します。画像あたりのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
**** コンピュータ使用の課金では Gemini 2.5 Pro SKU が使用されます。コンピュータ使用の費用を分割するには、課金タグを適用します。詳しくは、こちらをご覧ください。

LiveAPI セッションのコンテキストウィンドウの課金について: セッションコンテキストウィンドウに存在するすべてのトークンに対して、ターンごとに課金されます。セッションコンテキストウィンドウには、新しいトークン（現在のターン）と、以前のターンから蓄積されたすべてのトークンが含まれます。つまり、過去のターンのトークンは再処理され、構成されたコンテキストウィンドウのサイズまで、新しいターンごとに考慮されます。「ターン」とは、ユーザーの入力とモデルのレスポンスを 1 つにまとめたものです。
プロアクティブ音声モード: 有効にすると、LiveAPI がリッスンしている間、入力トークンが課金されます。出力トークンは、API が応答した場合にのみ課金されます。
音声文字変換が有効になっている場合、文字変換のために生成されたすべてのテキストトークンは、テキストトークン出力レートで課金されます。

Gemini 2.0

Gemini 2.0 はトークンに基づいて課金されます。リクエストを送信する前に、リクエスト内の入力トークンの数を計算するには、SDK トークン化ツールまたは countTokens API を使用できます。リクエストが 400 または 500 エラーで失敗した場合、使用されたトークンは課金されません。

料金表の切り替えボタンを使用して、トークンベースの料金とモダリティベースの料金を比較します。

トークンベースの料金

モデル	タイプ	料金	Batch API を使用した場合の料金
Gemini 2.0 Flash
	100 万個の入力トークン	$0.15	$0.075
	100 万個の入力音声トークン	$1.00	$0.50
	100 万個の出力テキストトークン	$0.60	$0.30
	100 万個のトレーニングトークンでチューニング	$3.00
Gemini 2.0 Flash Image Generation
	100 万個の入力トークン	$0.15
	100 万個の入力音声トークン	$1.00
	100 万個の入力動画トークン	$3
	100 万個の出力テキストトークン	$0.60
	100 万個の出力画像トークン	$30.00
Gemini 2.0 Flash Live API
	100 万個の入力テキストトークン	$0.5
	100 万個の入力音声トークン	$3
	100 万個の入力動画/画像トークン	$3
	100 万個の出力テキストトークン	$2
	100 万個の出力音声トークン	$12
Gemini 2.0 Flash Lite
	100 万個の入力トークン	$0.075	$0.0375
	100 万個の入力音声トークン	$0.075	$0.0375
	100 万個の出力テキストトークン	$0.30	$0.15
	100 万個のトレーニングトークンでチューニング	$1.00
Google 検索によるグラウンディング	Gemini 2.0 Flash と 2.5 Flash には、1 日あたり 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。これらの上限を超えるグラウンディングされたプロンプトは、1,000 個あたり 35 ドルで課金されます。グラウンディングされたプロンプトとは、Google 検索* に対して 1 つ以上のクエリを行う Gemini に送信されるリクエストです。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウントチームにお問い合わせください。
エンタープライズ向けウェブグラウンディング	1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブグラウンディングに対して 1 つ以上のクエリを実行するものです*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウントチームにお問い合わせください。
データによるグラウンディング	2025 年 6 月 16 日より、1,000 リクエストあたり $2.5。
Google マップによるグラウンディング	Gemini モデルには、追加料金なしで利用できるグラウンディングされたプロンプトが多数含まれています。 Gemini Flash と Flash-Lite: 1 日あたり合計 1,500 件のグラウンディングプロンプト。 Gemini Pro: 1 日あたり 10,000 件のグラウンディングプロンプト。これらの上限を超えるグラウンディングされたプロンプトは、グラウンディングされたプロンプト 1,000 件あたり 25 ドルで課金されます。グラウンディングされたプロンプトとは、Google マップに少なくとも 1 回クエリを行うよう Gemini に送信するリクエストです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウントチームにお問い合わせください。

モダリティベースの料金

以下のモダリティの料金は、平均的なユースケースに基づいており、参考としてのみご利用ください。実際の請求はトークンのみに基づいて行われます。

4 文字で、空白を含めて約 1 テキストトークンになります。

1024x1024 の画像の場合、1290 トークンを消費します。画像あたりのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。

動画入力は、1 秒あたり 1 フレームのサンプルレートで、1 秒あたり 258 トークンを消費します。音声付き動画では、動画トークンと音声トークンの両方に対して課金されます。

音声入力は、タイムスタンプなしで 1 秒あたり 25 トークンを消費します。

モデル	タイプ	料金	Batch API を使用した場合の料金
Gemini 2.0 Flash
	入力テキスト（$/100 万文字）	$0.0375	$0.01875
	入力画像（$/画像）	$0.0001935	$0.00009675
	入力動画（$/秒）	$0.0000387	$0.00001935
	音声入力（$/秒）	$0.000025	$0.0000125
	出力テキスト（$/100 万文字）	$0.15	$0.075
Gemini 2.0 Flash Image Generation
	入力テキスト（$/100 万文字）	$0.0375
	入力画像（$/画像）	$0.0001935
	入力動画（$/秒）	$0.0000387
	音声入力（$/秒）	$0.000025
	出力テキスト（$/100 万文字）	$0.15
	出力画像（画像あたり）	$0.04
Gemini 2.0 Flash Lite
	入力テキスト（$/100 万文字）	$0.01875	$0.009375
	入力画像（$/画像）	$0.00009675	$0.000048375
	入力動画（$/秒）	$0.00001935	$0.000009675
	音声入力（$/秒）	$0.000001875	$0.000000938
	出力テキスト（$/100 万文字）	$0.075	$0.0375
Google 検索によるグラウンディング	Gemini 2.0 Flash と 2.5 Flash には、1 日あたり 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。これらの上限を超えるグラウンディングされたプロンプトは、1,000 個あたり 35 ドルで課金されます。グラウンディングされたプロンプトとは、Google 検索* に対して 1 つ以上のクエリを行う Gemini に送信されるリクエストです。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウントチームにお問い合わせください。
エンタープライズ向けウェブグラウンディング	1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブグラウンディングに対して 1 つ以上のクエリを実行するものです*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウントチームにお問い合わせください。

* 料金は米ドル（USD）で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* トレーニングトークンの数は、トレーニングデータセット内のトークンの合計数にエポック数を掛けて計算されます。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングと企業向けウェブグラウンディングは、プロンプトがウェブの結果を正常に返した場合（つまり、ウェブからのグラウンディングサポート URL を少なくとも 1 つ含む結果）にのみ課金されます。Gemini モデルの使用料金は別途適用されます。
* Gemini 2.0 Flash Live API: 音声（入力/出力）は 1 秒あたり 25 トークン、動画（入力）は 1 秒あたり 258 トークン。Gemini 2.0 Flash Live API がプレビュー版である間は、Google 検索によるグラウンディングは引き続き無料でご利用いただけます。

LiveAPI セッションのコンテキストウィンドウの課金について: セッションコンテキストウィンドウに存在するすべてのトークンに対して、ターンごとに課金されます。セッションコンテキストウィンドウには、新しいトークン（現在のターン）と、以前のターンから蓄積されたすべてのトークンが含まれます。つまり、過去のターンのトークンは再処理され、構成されたコンテキストウィンドウのサイズまで、新しいターンごとに考慮されます。「ターン」とは、ユーザーの入力とモデルのレスポンスを 1 つにまとめたものです。
音声文字変換が有効になっている場合、文字変換のために生成されたすべてのテキストトークンは、テキストトークン出力レートで課金されます。

Vertex AI Model Optimizer の料金（試験運用版）*

Vertex AI Model Optimizer は、Gemini モデルのリクエストに対して単一のメタエンドポイントを提供することで、エンタープライズのお客様による Gemini の使用を簡素化します。このサービスを使用するお客様は、Flash、Pro、または特定のバージョンを使用するかどうかを指定する必要はありません。ユーザーは、好みを指定するために構成可能な設定（費用、品質、バランス）を指定するだけで済みます。Model Optimizer は、各クエリを最適なモデルに送信することで、タスクに適した適切なレベルのインテリジェンスを適用します。

Vertex AI Model Optimizer では、動的料金が適用されます。つまり、トークンあたりの平均価格は、タスクを完了するために適用されるモデルのインテリジェンスレベルによって異なります。そのため、構成設定に基づく可能性の高いシナリオを示すために、以下の料金例が提供されています（以下の表を参照）。Model Optimizer の SKU は、請求の適用単位として機能する 1 ドルの SKU です。モデルを使用した後も、使用量に基づいて請求されます。

5:1 の I/O 比率	例 1 chat bot	注: これらの範囲は保証されるものではなく、個々の顧客の結果は異なる場合があります。
お客様の好み	お客様の入力トークンが MO に送信される	お客様の出力トークンが MO に送信される	入力トークン 100 万個あたりの平均価格（高）	出力の平均価格（100 万トークンあたり）（高価格帯）	入力トークン 100 万個あたりの平均価格（低価格帯）	100 万トークンあたりの平均出力価格（低価格帯）
費用	10,000,000	2,000,000	$0.63	$2.50	$0.16	$0.63
バランス	10,000,000	2,000,000	$1.26	$5.00	$0.63	$2.50
品質	10,000,000	2,000,000	$1.89	$7.50	$1.26	$5.00

1:20 I/O 比率	例 2 コンテンツの生成
お客様の好み	お客様の入力トークンが MO に送信される	お客様の出力トークンが MO に送信される	入力トークン 100 万個あたりの平均価格（高）	出力の平均価格（100 万トークンあたり）（高価格帯）	入力トークン 100 万個あたりの平均価格（低価格帯）	100 万トークンあたりの平均出力価格（低価格帯）
費用	1,000,000	20,000,000	$0.63	$2.50	$0.16	$0.63
バランス	1,000,000	20,000,000	$1.26	$5.00	$0.63	$2.50
品質	1,000,000	20,000,000	$1.89	$7.50	$1.26	$5.00

* Model Optimizer は有料の試験運用版サービスであり、リクエストを Vertex 上の Gemini の試験運用版にルーティングする場合があります。

その他の Gemini モデル

Gemini 2.0 または Gemini 2.5 以外のすべての Gemini モデルは、文字数、画像、動画/音声の秒数などのモダリティに基づいて課金されます。テキスト入力は、入力（プロンプト）1,000 文字ごと、出力（レスポンス）1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。その結果、トークンあたり約 4 文字になります。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後で、1 セント（$0.01）未満の小数部分は、1 セントに切り上げられます。メディア入力は、画像ごと、または秒ごと（動画）に課金されます。リクエストが 400 または 500 エラーで失敗した場合、使用されたトークンは課金されません。

モデル	機能	タイプ	料金（=< 128,000 入力トークン）	料金（入力トークンが 128,000 を超える場合）
Gemini 1.5 Flash	マルチモーダル	画像入力動画入力テキスト入力音声入力	$0.00002 / 画像 $0.00002 / 秒 $0.00001875 / 1,000 文字 $0.000002 / 秒	$0.00004 / 画像 $0.00004 / 秒 $0.0000375 / 1,000 文字 $0.000004 / 秒
		テキスト出力	$0.000075 / 1,000 文字	$0.00015 / 1,000 文字
	チューニング*	トレーニングトークン	$8 / 100 万トークン
Gemini 1.5 Pro	マルチモーダル	画像入力動画入力テキスト入力音声入力	$0.00032875 / 画像 $0.00032875 / 秒 $0.0003125 / 1,000 文字 $0.00003125 / 秒	$0.0006575 / 画像 $0.0006575 / 秒 $0.000625 / 1,000 文字 $0.0000625 / 秒
		テキスト出力	$0.00125 / 1,000 文字	$0.0025 / 1,000 文字
	チューニング*	トレーニングトークン	$80 / 100 万トークン
Gemini 1.0 Pro	マルチモーダル	画像入力動画入力テキスト入力	$0.0025 / 画像 $0.002 / 秒 $0.000125 / 1,000 文字
Gemini 1.0 Pro		テキスト出力	$0.000375 / 1k 文字
Google 検索によるグラウンディング	テキスト	$35（1,000 件のグラウンディングされたプロンプトあたり）。グラウンディングされたプロンプトとは、Google 検索に対して 1 つ以上のクエリを行う Gemini に送信されるリクエストです*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングプロンプトが必要な場合は、アカウントチームにお問い合わせください。
エンタープライズ向けウェブグラウンディング	テキスト	1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブグラウンディングに対して 1 つ以上のクエリを実行します*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングプロンプトが必要な場合は、アカウントチームにお問い合わせください。
データによるグラウンディング	テキスト	2025 年 6 月 16 日より、1,000 リクエストあたり $2.5。

* 料金は米ドル（USD）で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* クエリのコンテキストが 128K より長い場合、すべてのトークンが長いコンテキストの料金で課金されます。
* Gemini モデルはバッチモードで 50% 割引で利用できます。
* Gemini 1.0 Pro は最大 32,000 のコンテキストウィンドウのみをサポートします。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングと企業向けウェブグラウンディングは、プロンプトがウェブの結果を正常に返した場合（つまり、ウェブからのグラウンディングサポート URL を 1 つ以上含む結果）にのみ課金されます。Gemini モデルの使用料は別途適用されます。

Imagen

Vertex AI の Imagen では、テキストプロンプトを送信することで、新しい画像の生成や画像の編集をしたり、またマスク領域を定義して画像の一部を編集したりできます。この他にも多くの機能を利用できます。

モデル	機能	説明	入力	出力	料金
Imagen 4 Ultra	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.06
Imagen 4	アップスケーリング	生成された画像の解像度を 2K、3K、4K に上げる	画像	画像	画像 1 枚あたり $0.06
Imagen 4	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.04
Imagen 4 Fast	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.02
Imagen 3	画像生成	画像を生成する画像を編集する画像をカスタマイズする	テキストプロンプト	画像	画像 1 枚あたり $0.04
Imagen 3 Fast	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.02
Imagen 2、Imagen 1	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.020
Imagen 2、Imagen 1	画像編集	マスクなしまたはマスクを使用して画像を編集する	画像 / テキストプロンプト	画像	画像 1 枚あたり $0.020
Imagen 1	アップスケーリング	生成された画像の解像度を 2K と 4K に上げる	画像	画像	画像 1 枚あたり $0.003
Imagen 1	ファインチューニング	ユーザーが提供した「テーマ」を Imagen のプロンプトとして使用できるようにする（few shot training）	テキスト識別子と 4-8 枚の画像を含めたテーマ	ファインチューニングされたモデル（ユーザーが提供したテーマでのトレーニング後）	1 ノード時間あたりの $（Vertex AI カスタムトレーニング料金）
Imagen	画像キャプション	画像に短い / 長いテキストキャプションを生成	画像	テキストキャプション	$0.0015 / 画像
Imagen	Visual Q&A	画像に関連した質問に対し回答を提供	画像 / テキストプロンプト	テキスト回答	$0.0015 / 画像
Imagen	プロダクトの再コンテキスト化	新しいシーンで製品を再考	同じ商品の画像 1 ～ 3 枚と、希望するシーンを説明するテキストプロンプト	画像	画像 1 枚あたり $0.12
	Vertex バーチャル試着	さまざまな服を着た人物の画像を作成する	人物の画像 1 枚と衣料品の画像 1 枚	画像	画像 1 枚あたり $0.06

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

Veo

Veo は、現実世界の物理法則や人物の動作と表情のニュアンスに対する理解が向上し、幅広いテーマやスタイルで非常に高品質な動画を作成します。

モデル	機能	説明	入力	出力	出力解像度	料金
Veo 3.1	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音を含む高品質の動画を生成	テキスト/画像プロンプト	動画 + 音声	720p、1080p	$0.40/秒
Veo 3.1	動画生成	テキストプロンプトまたは参照画像から高品質の動画を生成	テキスト/画像プロンプト	動画	720p、1080p	$0.20/秒
Veo 3.1 Fast	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音を含む動画をより迅速に生成	テキスト/画像プロンプト	動画 + 音声	720p、1080p	$0.15/秒
Veo 3.1 Fast	動画生成	テキストプロンプトまたは参照画像から動画をより速く生成	テキスト/画像プロンプト	動画	720p、1080p	$0.10/秒
Veo 3	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音を含む高品質の動画を生成	テキスト/画像プロンプト	動画 + 音声	720p、1080p	$0.40/秒
Veo 3	動画生成	テキストプロンプトまたは参照画像から高品質の動画を生成	テキスト/画像プロンプト	動画	720p、1080p	$0.20/秒
Veo 3 Fast	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音を含む動画をより迅速に生成	テキスト/画像プロンプト	動画 + 音声	720p、1080p	$0.15/秒
Veo 3 Fast	動画生成	テキストプロンプトまたは参照画像から動画をより速く生成	テキスト/画像プロンプト	動画	720p、1080p	$0.10/秒
Veo 2	動画生成	テキストプロンプトまたは参照画像から動画を生成	テキスト/画像プロンプト	動画	720p	$0.50/秒
Veo 2	詳細設定	開始フレームと終了フレームの補間による動画生成、生成された動画の拡張、カメラ制御の適用	テキスト/画像/動画プロンプト	動画	720p	$0.50/秒

Lyria

Lyria 2 は、高品質のインストゥルメンタル音楽を生成します。ニュアンスのある出力が重要な、洗練された作曲や詳細なクリエイティブな探求に最適です。

モデル	機能	説明	入力	出力	料金
Lyria 2	音楽生成	テキストプロンプトから音楽を生成する	テキストプロンプト	音楽	30 秒あたり $0.06

AI アプリケーションのエンベディング費用を把握する

モデル	型	リージョン	1,000 入力トークンあたりの料金
Gemini エンべディング	入力	グローバル	オンラインリクエスト: $0.00015 バッチリクエスト: $0.00012
Gemini エンべディング	出力	グローバル	オンラインリクエスト: 無料バッチリクエスト: 無料

モデル	型	リージョン	1,000 文字あたりの料金
テキストのエンベディング（Gemini エンベディングを除く）	入力	グローバル	オンラインリクエスト: $0.000025 バッチリクエスト: $0.00002
テキストのエンベディング（Gemini エンベディングを除く）	出力	グローバル	オンラインリクエスト: 無料バッチリクエスト: 無料

モデル	機能	説明	入力	出力	料金
multimodalembedding	マルチモーダルのエンベディング: テキスト	テキストを入力としてエンベディングを生成	テキスト	エンベディング	$0.0002 / 入力 1,000 文字
	マルチモーダルのエンベディング: 画像	画像を入力としてエンベディングを生成	画像	エンベディング	$0.0001 / 画像入力
	マルチモーダルのエンベディング: 動画プラス	Video Plus	動画	エンベディング（動画 1 分あたり最大 15 個）	動画 1 秒あたり $0.0020
	マルチモーダルのエンベディング: 動画（標準）	動画標準	動画	エンベディング（動画 1 分あたり最大 8 個）	動画 1 秒あたり $0.0010
	マルチモーダルのエンベディング: 動画の基本	動画の基本	動画	エンベディング（動画 1 分あたり最大 4 つのエンベディング）	動画 1 秒あたり $0.0005

オープンソースモデル	タイプ	1,000 入力トークンあたりの料金
multilingual-e5-small	入力: 出力: バッチ入力: バッチ出力:	オンラインリクエスト: $0.000015 オンラインリクエスト: 無料バッチリクエスト: $0.0000075 バッチリクエスト: 無料
multilingual-e5-large	入力: 出力: バッチ入力: バッチ出力:	オンラインリクエスト: $0.000025 オンラインリクエスト: 無料バッチリクエスト: $0.0000125 バッチリクエスト: 無料

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

Vertex AI のコード補完の料金

Vertex AI における生成 AI の利用では、入力（プロンプト）1,000 文字ごと、出力（レスポンス）1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後で、1 セント（$0.01）未満の小数部分は、1 セントに切り上げられます。

モデル	型	リージョン	1,000 文字あたりの料金
コード補完用 Codey	入力	グローバル	オンラインリクエスト: $0.00025
コード補完用 Codey	出力	グローバル	オンラインリクエスト: $0.0005

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

翻訳（テキスト）

Vertex AI API と翻訳 LLM を使用してテキストを翻訳します。LLM による翻訳は、従来の翻訳モデルよりも流暢で人間が話しているように聞こえる傾向がありますが、言語サポートはより限定的です（詳細）。

モデル	メソッド	用途	100 万文字あたりの料金
LLM	テキスト翻訳^*	1 か月あたりの入力文字数	$10/100 万文字^*
	テキスト翻訳^*	1 か月あたりの出力文字数	$10/100 万文字^*

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
^*料金は、モデルで処理された文字数に基づきます。文字のカウントについての詳細は、課金対象の文字をご覧ください。

明示的なキャッシュ保存のコンテキストキャッシュストレージの料金

モデル	機能	タイプ	料金（100 万トークンあたり）入力トークン 20 万個以下	料金（100 万トークンあたり） > 20 万入力トークン
Gemini 3 Pro	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$4.5（/M トークン/時間）	$4.5（/M トークン/時間）
Gemini 2.5 Pro	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$4.5（/M トークン/時間）	$4.5（/M トークン/時間）
Gemini 2.5 Flash	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$1（/100 万トークン/時間）	$1（/100 万トークン/時間）
Gemini 2.5 Flash Lite	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$1（/100 万トークン/時間）	$1（/100 万トークン/時間）

Gemini 2.0 モデル

トークンベースの料金

モデル	タイプ	ストレージ（M トークン時間）	料金
Gemini 2.0 Flash
	100 万個の入力トークン	$1.00	$0.0375
	100 万個の入力音声トークン	$1.00	$0.25
	100 万個の出力テキストトークン	なし	なし
Gemini 2.0 Flash Lite
	100 万個の入力トークン	$1.00	$0.01875
	100 万個の入力音声トークン	$1.00	$0.01875
	100 万個の出力テキストトークン	なし	なし

モダリティベースの料金

4 文字で、空白を含めて約 1 テキストトークンになります。

音声入力は、タイムスタンプなしで 1 秒あたり 25 トークンを消費します。

モデル	タイプ	ストレージ（モダリティ時間）	料金
Gemini 2.0 Flash
	入力テキスト（$/100 万文字）	$0.25	$0.009375
	入力画像（$/画像）	$0.00129	$0.000048375
	入力動画（$/秒）	$0.000258	$0.000009675
	音声入力（$/秒）	$0.000025	$0.00000625
	出力テキスト（$/100 万文字）	なし	なし
Gemini 2.0 Flash Lite
	入力テキスト（$/100 万文字）	$0.25	$0.0046875
	入力画像（$/画像）	$0.00129	$0.0000241875
	入力動画（$/秒）	$0.000258	$0.000009675
	音声入力（$/秒）	$0.000258	$0.0000048375
	出力テキスト（$/100 万文字）	なし	なし
Google 検索によるグラウンディング	Gemini 2.0 Flash には、1 日あたり最大 1,500 件のグラウンディングされたリクエストが追加料金なしで含まれています。1 日あたり 1,500 件を超えるグラウンディングされたリクエストは、1,000 件あたり 35 ドルで課金されます（1 日あたり最大 100 万件）。 1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウントチームにお問い合わせください。
エンタープライズ向けウェブグラウンディング	2025 年 5 月 5 日より、リクエスト 1,000 件あたり $45（1 日あたり最大 100 万件のリクエスト）。 1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウントチームにお問い合わせください。

* 料金は米ドル（USD）で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングは、ウェブからグラウンディングサポート URL を 1 つ以上含む結果を返すリクエストに対してのみ課金されます。標準の Gemini モデルの使用料金も適用されます。

プロビジョンドスループット

プロビジョンドスループットは、生成 AI のニーズに合わせてスループットを確保し、生成 AI スケールユニット（GSU）を介して取引されます。各 GSU で提供されるスループットについて詳しくは、こちらをご覧ください。オンライン見積もりツールはこちらからご利用いただけます。

期間	GSU あたりの料金	1 日あたり
1 週間のコミットメント	$1,200	1 週間
1 か月契約	2,700 ドル	月
3 か月契約	$2,400	月
1 年契約	$2,000	月

料金計算の例

ユーザーは、gemini-2.0-flash を使用して、1,000 個のテキストトークンと 500 個の音声トークンの入力を含むクエリの 1 秒あたり 10 件の秒間クエリ数（QPS）をサポートし、300 個のテキストトークンの出力を受け取ることができるようにする必要があります。

スループットとバーンダウン率の表を使用すると、gemini-2.0-flash の場合、入力テキストトークンのバーンダウン率は 1 トークン、入力音声トークンのバーンダウン率は 7 トークン、出力テキストトークンのバーンダウン率は 4 トークンであることがわかります。

ユーザーの入力トークンの合計数は、1,000*（入力テキストトークンあたり 1 トークン）+ 500*（入力音声トークンあたり 7 トークン）= 4,500 個のバーンダウン調整済み入力トークンです。ユーザーの出力トークンの合計は 300 *（出力テキストトークンあたり 4 トークン）= 1,200 個のバーンダウン調整済み出力トークンです。これらを合計すると、入力トークン（バーンダウン調整後）4,500 個 + 出力トークン（バーンダウン調整後）1,200 個 = クエリあたりの合計トークン数 5,700 個となります。

クエリあたりの合計トークン数に QPS を掛けると、クエリあたりの合計トークン数 5,700 個 × 10 QPS = 1 秒あたりの合計トークン数 57,000 個となります。

これを GSU あたりの 1 秒あたりの合計スループットで割ると、1 秒あたりの合計トークン数 57,000 ÷ GSU あたりの 1 秒あたりのスループット 3,360 = 16.96 GSU となります。このモデルの最小 GSU 購入単位は 1 なので、ユーザーは 17 GSU を購入する必要があります。

このスループットを 1 週間維持する場合、費用は 1,200 ドル * 17 GSU = 20,400 ドル / 週となります。このスループットを 1 か月維持する場合、費用は $2,700 × 17 GSU = 月額 $45,900 となります。このスループットを 3 か月間維持する場合、費用は 1 か月あたり $2,400 × 17 GSU = $40,800 となります。最後に、このスループットを 1 年間維持する場合、費用は 1 か月あたり $2,000 * 17 GSU = $34,000 となります。

モデルのチューニング

モデルのチューニングは、大規模なモデルをタスクに合わせてカスタマイズする効果的な方法です。これは、モデルの品質と効率性を改善するための重要なステップです。モデルのチューニングには次の利点があります。

特定のタスクの品質が向上する
モデルの堅牢性が向上する
プロンプトが短くなるため、推論のレイテンシとコストが低減される

チューニングは、トレーニングトークン 100 万個ごとに課金されます。トレーニングトークンの数は、トレーニングデータセット内のトークンの合計数にエポック数を掛けて計算されます。モデル推論の場合、Gemini チューニング済みモデルのエンドポイントの予測料金はベースモデルと同じです。

モデル	タイプ	料金（100 万トレーニングトークンあたり）
Gemini 2.5 Pro	教師ありファインチューニング	$25
Gemini 2.5 Flash	教師ありファインチューニングプリファレンスチューニング	$5
Gemini 2.5 Flash Lite	教師ありファインチューニングプリファレンスチューニング	$1.5
Gemma 3 27B IT	教師ありファインチューニング	$6.83
Llama 3.1 8B	教師ありファインチューニング	0.67 ドル
Llama 3.2 1B	教師ありファインチューニング	$0.28
Llama 3.2 3B	教師ありファインチューニング	$0.61
Llama 3.3 70B	教師ありファインチューニング	$6.72
Llama 4 Scout 17B 16E	教師ありファインチューニング	$5.77
Qwen 3 32B	教師ありファインチューニング	$6.57

* トレーニングトークンの数は、トレーニングデータセット内のトークンの合計数にエポック数を掛けて計算されます。
* Gemini チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。

Vertex AI のパートナーモデルの料金を比較する

パートナーモデルは、Google パートナーが開発した生成 AI モデルの厳選されたリストです。パートナーモデルは、マネージド API として提供されます。詳細については、パートナーモデルの概要をご覧ください。以下のセクションでは、Google パートナーモデルの料金の詳細を記載しています。

AI21 Labs のモデル

モデル	料金
Jamba 1.5 Large（非推奨）	入力: 100 万トークンあたり $2 出力: 100 万トークンあたり $8
Jamba 1.5 Mini（非推奨）	入力: 100 万トークンあたり $0.20 出力: 100 万トークンあたり $0.40

Anthropic の Claude モデル

地域別の料金が設定されているモデル

グローバル

モデル	料金（100 万トークンあたり）< 20 万入力トークン	料金（100 万トークンあたり）>= 20 万入力トークン
Claude Opus 4.5	入力: $5.00 出力: $25.00 バッチ入力: $2.50 バッチ出力: $12.50 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュヒット: $0.50 5 分バッチキャッシュ書き込み: $3.125 1 時間バッチキャッシュ書き込み: $5.00 バッチキャッシュヒット: $0.25
Claude Sonnet 4.5	入力: $3.00 出力: $15.00 バッチ入力: $1.50 バッチ出力: $7.50 5 分キャッシュ書き込み: $3.75 1 時間キャッシュ書き込み: $6.00 キャッシュヒット: $0.30 バッチキャッシュ書き込み: $1.88 バッチキャッシュヒット: $0.15	入力: $6.00 出力: $22.50 バッチ入力: $3.00 バッチ出力: $11.25 5 分キャッシュ書き込み: $7.50 1 時間キャッシュ書き込み: $12.00 キャッシュヒット: $0.60 バッチキャッシュ書き込み: $3.75 バッチキャッシュヒット: $0.30
Claude Haiku 4.5	入力: $1.00 出力: $5.00 バッチ入力: $0.50 バッチ出力: $2.50 5 分キャッシュ書き込み: $1.25 1 時間キャッシュ書き込み: $2.00 キャッシュヒット: $0.10 バッチキャッシュ書き込み: $0.625 バッチキャッシュヒット: $0.05

us-east5

モデル	料金（100 万トークンあたり）< 20 万入力トークン	料金（100 万トークンあたり）>= 20 万入力トークン
Claude Opus 4.5	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275
Claude Sonnet 4.5	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 バッチキャッシュ書き込み: $2.06 バッチキャッシュヒット: $0.17	入力: $6.60 出力: $24.75 バッチ入力: $3.30 バッチ出力: $12.38 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュヒット: $0.66 バッチキャッシュ書き込み: $4.13 バッチキャッシュヒット: $0.33
Claude Haiku 4.5	入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュ書き込み: $1.375 キャッシュヒット: $0.11 バッチキャッシュ書き込み: $0.688 バッチキャッシュヒット: $0.055

europe-west1

モデル	料金（100 万トークンあたり）< 20 万入力トークン	料金（100 万トークンあたり）>= 20 万入力トークン
Claude Opus 4.5	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275
Claude Sonnet 4.5	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 バッチキャッシュ書き込み: $2.06 バッチキャッシュヒット: $0.17	入力: $6.60 出力: $24.75 バッチ入力: $3.30 バッチ出力: $12.38 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュヒット: $0.66 バッチキャッシュ書き込み: $4.13 バッチキャッシュヒット: $0.33
Claude Haiku 4.5	入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュヒット: $0.11 バッチキャッシュ書き込み: $0.688 バッチキャッシュヒット: $0.055

asia-southeast1

モデル	料金（100 万トークンあたり）< 20 万入力トークン	料金（100 万トークンあたり）>= 20 万入力トークン
Claude Opus 4.5	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275
Claude Sonnet 4.5	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 バッチキャッシュ書き込み: $2.06 バッチキャッシュヒット: $0.17	入力: $6.60 出力: $24.75 バッチ入力: $3.30 バッチ出力: $12.38 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュヒット: $0.66 バッチキャッシュ書き込み: $4.13 バッチキャッシュヒット: $0.33

asia-east1

モデル	料金（100 万トークンあたり）< 20 万入力トークン	料金（100 万トークンあたり）>= 20 万入力トークン
Claude Haiku 4.5	入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュ書き込み: $1.375 キャッシュヒット: $0.11 バッチキャッシュ書き込み: $0.688 バッチキャッシュヒット: $0.055

* クエリ入力コンテキストが 200, 000 トークン以上の場合、すべてのトークン（入力と出力）に長いコンテキストの料金が適用されます。

すべてのリージョンで料金が均一なモデル

モデル	料金（100 万トークンあたり）< 20 万入力トークン	料金（100 万トークンあたり）>= 20 万入力トークン
Claude Opus 4.1	入力: $15 出力: $75 バッチ入力: $7.50 バッチ出力: $37.50 5 分間のキャッシュ書き込み: $18.75 1 時間のキャッシュ書き込み: $30 キャッシュヒット: $1.50 バッチキャッシュ書き込み: $9.375 バッチキャッシュヒット: $0.75	なし
Claude Opus 4	入力: $15 出力: $75 バッチ入力: $7.50 バッチ出力: $37.50 5 分間のキャッシュ書き込み: $18.75 1 時間のキャッシュ書き込み: $30 キャッシュヒット: $1.50 バッチキャッシュ書き込み: $9.375 バッチキャッシュヒット: $0.75	なし
Claude Sonnet 4	入力: $3 出力: $15 バッチ入力: $1.50 バッチ出力: $7.50 5 分キャッシュ書き込み: $3.75 1 時間キャッシュ書き込み: $6.00 キャッシュヒット: $0.30 バッチキャッシュ書き込み: $1.875 バッチキャッシュヒット: $0.15	入力: $6 出力: $22.50 バッチ入力: $3 バッチ出力: $11.25 5 分キャッシュ書き込み: $7.50 1 時間キャッシュ書き込み: $12.00 キャッシュヒット: $0.60 バッチキャッシュ書き込み: $3.75 バッチキャッシュヒット: $0.30
Claude 3 Haiku	入力: $0.25 出力: $1.25 5 分キャッシュ書き込み: $0.30 1 時間キャッシュ書き込み: $0.50 キャッシュヒット: $0.03	なし
Claude 3.5 Haiku（非推奨）	入力: $0.80 出力: $4 バッチ入力: $0.40 バッチ出力: $2 5 分キャッシュ書き込み: $1 1 時間キャッシュ書き込み: $1.60 キャッシュヒット: $0.08 バッチキャッシュ書き込み: $0.50 バッチキャッシュヒット: $0.04	なし
Claude 3.7 Sonnet（非推奨）	入力: $3 出力: $15 バッチ入力: $1.50 バッチ出力: $7.50 キャッシュ書き込み: $3.75 キャッシュヒット: $0.30 バッチキャッシュ書き込み: $1.875 バッチキャッシュヒット: $0.15	なし
Claude 3.5 Sonnet v2（非推奨）	入力: $3 出力: $15 バッチ入力: $1.50 バッチ出力: $7.50 キャッシュ書き込み: $3.75 キャッシュヒット: $0.30 バッチキャッシュ書き込み: $1.875 バッチキャッシュヒット: $0.15	なし
Claude 3.5 Sonnet（非推奨）	入力: $3 出力: $15 キャッシュ書き込み: $3.75 キャッシュヒット: $0.30	なし
Claude 3 Opus（非推奨）	入力: $15 出力: $75 キャッシュ書き込み: $18.75 キャッシュヒット: $1.50	なし

* クエリ入力コンテキストが 200, 000 トークン以上の場合、すべてのトークン（入力と出力）に長いコンテキストの料金が適用されます。

ツールの料金

ツール	料金
ウェブ検索リクエスト	1,000 回の検索あたり 10 ドルサポートされているモデル: Claude Haiku 4.5、Claude Sonnet 4.5、Claude Sonnet 4、Claude Opus 4.1、Claude Opus 4

* クエリ入力コンテキストが 200, 000 トークン以上の場合、すべてのトークン（入力と出力）に長いコンテキストの料金が適用されます。

DeepSeek のモデル

モデル	料金
DeepSeek-V3.1	入力: 100 万トークンあたり $0.60 出力: 100 万トークンあたり $1.70 バッチ入力: 100 万トークンあたり $0.30 バッチ出力: 100 万トークンあたり $0.85
DeepSeek-V3.2 *	入力: 100 万トークンあたり $0.56 出力: 100 万トークンあたり $1.68 バッチ入力: 100 万トークンあたり $0.28 バッチ出力: 100 万トークンあたり $0.84
DeepSeek-R1（0528）	入力: 100 万トークンあたり $1.35 出力: 100 万トークンあたり $5.40 バッチ入力: 100 万トークンあたり $0.675 バッチ出力: 100 万トークンあたり $2.70
DeepSeek-OCR	入力: 100 万トークンあたり $0.30（または 1 ページあたり $0.0003）出力: 100 万トークンあたり $1.20（または 1 ページあたり $0.00012）

2025 年 12 月 17 日まで無料。

MiniMax のモデル

モデル	料金
MiniMax-M2	入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $1.20

Moonshot のモデル

モデル	料金
Kimi-K2-Thinking	入力: 100 万トークンあたり $0.60 出力: 100 万トークンあたり $2.50

Qwen のモデル

モデル	料金
Qwen3-Next-80B-Thinking	入力: 100 万トークンあたり $0.15 出力: 100 万トークンあたり $1.20
Qwen3-Next-80B-Instruct	入力: 100 万トークンあたり $0.15 出力: 100 万トークンあたり $1.20
Qwen3-Coder-480B-A35B-Instruct	入力: 100 万トークンあたり $0.22 出力: 100 万トークンあたり $1.80 バッチ入力: 100 万トークンあたり $0.11 バッチ出力: 100 万トークンあたり $0.90
Qwen3-235B-A22B-Instruct-2507	入力: 100 万トークンあたり $0.22 出力: 100 万トークンあたり $0.88 バッチ入力: 100 万トークンあたり $0.11 バッチ出力: 100 万トークンあたり $0.44

OpenAI のモデル

モデル	料金
gpt-oss-120b	入力: 100 万トークンあたり $0.09 出力: 100 万トークンあたり $0.36 バッチ入力: 100 万トークンあたり $0.045 バッチ出力: 100 万トークンあたり $0.18
gpt-oss-20b	入力: 100 万トークンあたり $0.07 出力: 100 万トークンあたり $0.25 バッチ入力: 100 万トークンあたり $0.035 バッチ出力: 100 万トークンあたり $0.125

Meta の Llama モデル

モデル	料金
Llama 3.1 405B	入力: 100 万トークンあたり $5.00 出力: 100 万トークンあたり $16.00
Llama 3.3 70B	入力: 100 万トークンあたり $0.72 出力: 100 万トークンあたり $0.72 バッチ入力: 100 万トークンあたり $0.36 バッチ出力: 100 万トークンあたり $0.36
Llama 4 Scout	入力: 100 万トークンあたり $0.25 出力: 100 万トークンあたり $0.70 バッチ入力: 100 万トークンあたり $0.125 バッチ出力: 100 万トークンあたり $0.35
Llama 4 Maverick	入力: 100 万トークンあたり $0.35 出力: 100 万トークンあたり $1.15 バッチ入力: 100 万トークンあたり $0.175 バッチ出力: 100 万トークンあたり $0.575

Mistral AI のモデル

モデル	料金
Mistral OCR（25.05）	入力: 100 万トークンあたり $0.0005（または 1 ページあたり $0.0005）出力: 100 万トークンあたり $0.0005（または 1 ページあたり $0.0005）
Mistral Medium 3	入力: 100 万トークンあたり $0.40 出力: 100 万トークンあたり $2.00
Mistral Small 3.1（25.03）	入力: 100 万トークンあたり $0.10 出力: 100 万トークンあたり $0.30
Mistral Large（24.11）（非推奨）	入力: 100 万トークンあたり $2.00 出力: 100 万トークンあたり $6.00
Codestral 2	入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $0.90
Codestral（25.01）（非推奨）	入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $0.90

カスタム見積もりをリクエストする

Google Cloud の従量課金制では、使用したサービスに対してのみ料金が発生します。カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

お問い合わせ

Vertex AI での AI モデルの構築とデプロイの費用

Google モデル

Gemini 3

Gemini 2.5

Gemini 2.0

トークンベースの料金

モダリティベースの料金

Vertex AI Model Optimizer の料金（試験運用版）*

その他の Gemini モデル

Imagen

Veo

Lyria

AI アプリケーションのエンベディング費用を把握する

Vertex AI のコード補完の料金

翻訳（テキスト）

明示的なキャッシュ保存のコンテキスト キャッシュ ストレージの料金

Gemini 2.0 モデル

トークンベースの料金

モダリティベースの料金

プロビジョンド スループット

料金計算の例

モデルのチューニング

Vertex AI のパートナー モデルの料金を比較する

AI21 Labs のモデル

Anthropic の Claude モデル

地域別の料金が設定されているモデル

グローバル

us-east5

europe-west1

asia-southeast1

asia-east1

すべてのリージョンで料金が均一なモデル

ツールの料金

DeepSeek のモデル

MiniMax のモデル

Moonshot のモデル

Qwen のモデル

OpenAI のモデル

Meta の Llama モデル

Mistral AI のモデル

カスタム見積もりをリクエストする

明示的なキャッシュ保存のコンテキストキャッシュストレージの料金

プロビジョンドスループット

Vertex AI のパートナーモデルの料金を比較する