Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Agent Platform での AI モデルの構築とデプロイの費用

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

課金されるのは、200 レスポンスコードを返すリクエストのみです。4xx や 5xx などの他のレスポンスコードを返すリクエストでは、入力や出力に対して料金は発生しません。

このページでは、Agent Platform の生成 AI の料金について説明します。ML Platform や MLOps サービスなど、Agent Platform のその他の料金については、Agent Platform の料金ページをご覧ください。

Google モデル

Gemini 3

標準

モデル	タイプ	料金（100 万トークンあたり）<= 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン	料金（100 万トークンあたり）<= 20 万個のキャッシュ入力トークン	料金（100 万トークンあたり）> 20 万個のキャッシュ入力トークン
Gemini 3.1 Pro プレビュー版
	入力（テキスト、画像、動画、音声）	$2	$4	$0.2	$0.4
	テキスト出力（回答と推論）	$12	$18	なし	なし
Gemini 3.5 Flash
	入力（テキスト、画像、動画、音声）	$1.50（グローバル） $1.65（グローバル以外）*	$1.50（グローバル） $1.65（グローバル以外）*	$0.15（グローバル） $0.165（グローバル以外）*	$0.15（グローバル） $0.165（グローバル以外）*
	テキスト出力（回答と推論）	9.00 ドル（グローバル） 9.90 ドル（グローバル以外）*	9.00 ドル（グローバル） 9.90 ドル（グローバル以外）*	なし	なし
Gemini 3 Flash プレビュー
	入力（テキスト、画像、動画）	$0.5	$0.5	$0.05	$0.05
	入力（音声）	$1	$1	$0.1	$0.1
	テキスト出力（回答と推論）	$3	$3	なし	なし
Gemini 3.1 Flash-Lite
	入力（テキスト、画像、動画）	$0.25（グローバル） $0.275（非グローバル）*	$0.25（グローバル） $0.275（非グローバル）*	$0.025（グローバル） $0.0275（非グローバル）*	$0.025（グローバル） $0.0275（非グローバル）*
	入力（音声）	$0.5（グローバル） $0.55（グローバル以外）*	$0.5（グローバル） $0.55（グローバル以外）*	$0.05（グローバル） $0.055（グローバル以外）*	$0.05（グローバル） $0.055（グローバル以外）*
	テキスト出力（回答と推論）	$1.5（グローバル） $1.65（グローバル以外）*	$1.5（グローバル） $1.65（グローバル以外）*	なし	なし
Gemini 3 Pro Image
	入力（テキスト、画像）	$2	なし	なし	なし
	テキスト出力（回答と推論）	$12	なし	なし	なし
	画像出力**	$120	なし	なし	なし
Gemini 3.1 Flash Image
	入力（テキスト、画像、動画）	$0.50	なし	なし	なし
	テキスト出力（回答と推論）	$3	なし	なし	なし
	画像出力***	$60	なし	なし	なし

優先度

モデル	タイプ	料金（100 万トークンあたり）<= 優先度付き 20 万入力トークン	料金（100 万トークンあたり）> 優先度ありの 20 万入力トークン	料金（100 万トークンあたり）<= 20 万個のキャッシュに保存された入力トークン（優先度あり）	料金（100 万トークンあたり）> 優先度付きの 20 万個のキャッシュ入力トークン
Gemini 3.1 Pro プレビュー版
	入力（テキスト、画像、動画、音声）	3.6 ドル	7.2 ドル	$0.36	$0.72
	テキスト出力（回答と推論）	$21.6	$32.4	なし	なし
Gemini 3.5 Flash
	入力（テキスト、画像、動画、音声）	$2.70（グローバル） $2.97（グローバル以外）*	$2.70（グローバル） $2.97（グローバル以外）*	$0.27（グローバル） $0.297（グローバル以外）*	$0.27（グローバル） $0.297（グローバル以外）*
	テキスト出力（回答と推論）	$16.20（グローバル） $17.82（グローバル以外）*	$16.20（グローバル） $17.82（グローバル以外）*	なし	なし
Gemini 3 Flash プレビュー
	入力（テキスト、画像、動画）	$0.9	$0.9	$0.09	$0.09
	入力（音声）	$1.8	$1.8	$0.18	$0.18
	テキスト出力（回答と推論）	$5.40	$5.40	なし	なし
Gemini 3.1 Flash-Lite
	入力（テキスト、画像、動画）	$0.45（グローバル） $0.495（非グローバル）*	$0.45（グローバル） $0.495（非グローバル）*	$0.045（グローバル） $0.0495（非グローバル）*	$0.045（グローバル） $0.0495（非グローバル）*
	入力（音声）	$0.9（グローバル） $0.99（グローバル以外）*	$0.9（グローバル） $0.99（グローバル以外）*	$0.09（グローバル） $0.099（グローバル以外）*	$0.09（グローバル） $0.099（グローバル以外）*
	テキスト出力（回答と推論）	2.7 ドル（グローバル） 2.97 ドル（グローバル以外）*	2.7 ドル（グローバル） 2.97 ドル（グローバル以外）*	なし	なし
Gemini 3 Pro Image
	入力（テキスト、画像、動画、音声）	なし	なし	なし	なし
	テキスト出力（回答と推論）	なし	なし	なし	なし
	画像出力**	なし	なし	なし	なし
Gemini 3.1 Flash Image
	入力（テキスト、画像、動画）	なし	なし	なし	なし
	テキスト出力（回答と推論）	なし	なし	なし	なし
	画像出力***	なし	なし	なし	なし

柔軟/バッチ

モデル	タイプ	料金（100 万トークンあたり）<= 20 万入力トークン（Flex / バッチ）	料金（100 万トークンあたり）> 20 万入力トークン（柔軟 / バッチ）	料金（100 万トークンあたり）<= 20 万個のキャッシュ入力トークン（Flex / Batch）	料金（100 万トークンあたり）> 200,000 個のキャッシュ入力トークン（Flex / Batch）
Gemini 3.1 Pro プレビュー版
	入力（テキスト、画像、動画、音声）	$1	$2	なし	なし
	テキスト出力（回答と推論）	$6	$9	なし	なし
Gemini 3.5 Flash
	入力（テキスト、画像、動画、音声）	$0.75（グローバル） $0.825（グローバル以外）*	$0.75（グローバル） $0.825（グローバル以外）*	バッチ: $0.075（グローバル）フレックス: $0.08（グローバル） $0.0825（非グローバル）*	バッチ: $0.075（グローバル）フレックス: $0.08（グローバル） $0.0825（非グローバル）*
	テキスト出力（回答と推論）	$4.50（グローバル） $4.95（グローバル以外）*	$4.50（グローバル） $4.95（グローバル以外）*	なし	なし
Gemini 3 Flash プレビュー
	入力（テキスト、画像、動画）	$0.25	$0.25	なし	なし
	入力（音声）	$0.5	$0.5	なし	なし
	テキスト出力（回答と推論）	$1.5	$1.5	なし	なし
Gemini 3.1 Flash-Lite
	入力（テキスト、画像、動画）	$0.125（グローバル） $0.1375（非グローバル）*	$0.125（グローバル） $0.1375（非グローバル）*	$0.0125（グローバル） $0.01375（非グローバル）*	$0.0125（グローバル） $0.01375（非グローバル）*
	入力（音声）	$0.25（グローバル） $0.275（非グローバル）*	$0.25（グローバル） $0.275（非グローバル）*	$0.025（グローバル） $0.0275（非グローバル）*	$0.025（グローバル） $0.0275（非グローバル）*
	テキスト出力（回答と推論）	$0.75（グローバル） $0.825（グローバル以外）*	$0.75（グローバル） $0.825（グローバル以外）*	なし	なし
Gemini 3 Pro Image
	入力（テキスト、画像）	$1	なし	なし	なし
	テキスト出力（回答と推論）	$6	なし	なし	なし
	画像出力**	$60	なし	なし	なし
Gemini 3.1 Flash Image
	入力（テキスト、画像、動画）	$0.25	なし	なし	なし
	テキスト出力（回答と推論）	$1.50	なし	なし	なし
	画像出力***	$30	なし	なし	なし

機能	料金
Google ウェブ検索と画像検索によるグラウンディング、エンタープライズ向けウェブグラウンディング	すべての Gemini 3 モデルで集計された、月あたり 5,000 件の検索クエリが無料で含まれます。これらの上限を超える検索クエリは、1,000 件あたり$14 で課金されます。お客様が Gemini に送信したリクエストにより、Google 検索（または Enterprise のウェブグラウンディング）に対する 1 つ以上のクエリが生成されることがあります。実行された個々の検索クエリごとに料金が請求されます。課金は 2026 年 1 月 5 日に開始されます。 Google 検索によるグラウンディングまたはエンタープライズ向けウェブグラウンディングで提供される入力トークンは課金対象外です。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、担当のアカウントチームにお問い合わせください。お客様は、標準料金で、グラウンディングされた検索結果とともに検索候補をお客様アプリケーションインターフェースに表示しないことを決定できます。
Google マップによるグラウンディング	すべての Gemini 3 モデルで集計された、月あたり 5,000 件の検索クエリが無料で含まれます。これらの上限を超える Maps クエリは、1,000 件あたり$14 で課金されます。お客様が Gemini にリクエストを送信すると、Google マップに対して 1 つ以上のクエリが実行されることがあります。実行された個々のクエリごとに課金されます。課金は 2026 年 1 月 5 日から開始 Google Maps から提供される入力トークンは課金対象外です。
データによるグラウンディング	プロンプト 1,000 件あたり $2.50。

* グローバル以外のエンドポイントの場合、一般提供版の Gemini 3 以降のモデルファミリーの料金は 2026 年 7 月 1 日に有効になります。2026 年 7 月 1 日より前は、グローバルエンドポイントの料金が非グローバルエンドポイントに適用されます。
* クエリ入力コンテキストが 200, 000 トークンより長い場合、すべてのトークン（入力と出力）が長いコンテキストの料金で課金されます。
* チューニング済みモデルのエンドポイントは、ベースモデルの 1.5 倍になります。
** Gemini 3 Pro Image の料金は、入力画像 1 枚あたり 560 トークン（$0.0011）です。出力画像の料金は解像度に応じて変動し、1K および 2K（約 1 メガピクセルと 4 メガピクセル）の場合は 1, 120 トークン（$0.134）、4K（約 16 メガピクセル）の場合は 2,000 トークン（$0.24）です。
*** Gemini 3.1 Flash Image では、入力画像 1 枚あたり 1, 120 トークン（$0.0006）が課金されます。出力画像の費用は解像度に応じてスケーリングされます。512（約 0.25 メガピクセル）の場合は 747 トークン（出力画像 1 枚あたり $0.045）、1K（約 1 メガピクセル）の場合は 1,120 トークン（$0.067）、2K（約 4 メガピクセル）の場合は 1,680 トークン（$0.101）、4K（約 16 メガピクセル）の場合は 2,520 トークン（$0.15）です。

エージェント

モデル	タイプ	料金（100 万トークンあたり）	料金（キャッシュされた入力トークン 100 万個あたり）
Gemini Deep Research エージェント	入力（テキスト）	$2	$0.2
Gemini Deep Research エージェント	テキスト出力（回答と推論）	$12	なし

機能

料金

Google ウェブ検索と画像検索によるグラウンディング、エンタープライズ向けウェブグラウンディング

すべての Gemini 3 モデルで集計された、月あたり 5,000 件の検索クエリが無料で含まれます。

これらの上限を超える検索クエリは、1,000 件あたり$14 で課金されます。お客様が Gemini に送信したリクエストにより、Google 検索（または Enterprise のウェブグラウンディング）に対する 1 つ以上のクエリが生成されることがあります。実行された個々の検索クエリごとに料金が請求されます。課金は 2026 年 1 月 5 日に開始されます。

Google 検索によるグラウンディングまたはエンタープライズ向けウェブグラウンディングで提供される入力トークンは課金対象外です。

1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、担当のアカウントチームにお問い合わせください。

お客様は、標準料金で、グラウンディングされた検索結果とともに検索候補をお客様アプリケーションインターフェースに表示しないことを決定できます。

データによるグラウンディング

プロンプト 1,000 件あたり $2.50。

Gemini 2.5

標準

モデル	タイプ	料金（100 万トークンあたり）<= 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン	料金（100 万トークンあたり）<= 20 万個のキャッシュ入力トークン	料金（100 万トークンあたり）> 20 万個のキャッシュ入力トークン
Gemini 2.5 Pro
	入力（テキスト、画像、動画、音声）	$1.25	$2.50	$0.13	$0.25
	テキスト出力（回答と推論）	$10	$15	なし	なし
Gemini 2.5 Pro コンピュータの使用 - プレビュー
	入力（テキスト、画像、動画、音声）	$1.25	2.5 ドル	なし	なし
	テキスト出力（回答と推論）	$10.00	$15.00	なし	なし
Gemini 2.5 Flash
	入力（テキスト、画像、動画）	$0.30	$0.30	$0.03	$0.03
	オーディオ入力	$1	$1	$0.10	$0.10
	テキスト出力（回答と推論）	$2.50	$2.50	なし	なし
Gemini 2.5 Flash Image
	入力（テキスト、画像）***	$0.30	なし	なし	なし
	テキスト出力（回答と推論）	$2.50	なし	なし	なし
	画像出力***	$30	なし	なし	なし
Gemini 2.5 Flash Live API
	100 万個の入力テキストトークン	$0.5	$0.5	なし	なし
	100 万個の入力音声トークン	$3	$3	なし	なし
	100 万個の入力動画/画像トークン	$3	$3	なし	なし
	100 万個の出力テキストトークン	$2	$2	なし	なし
	100 万個の出力音声トークン	$12	$12	なし	なし
Gemini 2.5 Flash Lite
	入力（テキスト、画像、動画）	$0.10	$0.10	$0.01	$0.01
	オーディオ入力	$0.30	$0.30	$0.03	$0.03
	テキスト出力（回答と推論）	$0.40	$0.40	なし	なし

優先度

モデル	タイプ	料金（100 万トークンあたり）<= 優先度付き 20 万入力トークン	料金（100 万トークンあたり）> 優先度ありの 20 万入力トークン	料金（100 万トークンあたり）<= 20 万個のキャッシュに保存された入力トークン（優先度あり）	料金（100 万トークンあたり）> 優先度付きの 20 万個のキャッシュ入力トークン
Gemini 2.5 Pro
	入力（テキスト、画像、動画、音声）	$2.25	$4.50	$0.23	$0.45
	テキスト出力（回答と推論）	$18	$27	なし	なし
Gemini 2.5 Pro コンピュータの使用 - プレビュー
	入力（テキスト、画像、動画、音声）	なし	なし	なし	なし
	テキスト出力（回答と推論）	なし	なし	なし	なし
Gemini 2.5 Flash
	入力（テキスト、画像、動画）	$0.54	$0.54	$0.05	$0.05
	オーディオ入力	$1.80	$1.80	$0.18	$0.18
	テキスト出力（回答と推論）	$4.50	$4.50	なし	なし
Gemini 2.5 Flash Image
	入力（テキスト、画像）***	なし	なし	なし	なし
	テキスト出力（回答と推論）	なし	なし	なし	なし
	画像出力***	なし	なし	なし	なし
Gemini 2.5 Flash Live API
	100 万個の入力テキストトークン	なし	なし	なし	なし
	100 万個の入力音声トークン	なし	なし	なし	なし
	100 万個の入力動画/画像トークン	なし	なし	なし	なし
	100 万個の出力テキストトークン	なし	なし	なし	なし
	100 万個の出力音声トークン	なし	なし	なし	なし
Gemini 2.5 Flash Lite
	入力（テキスト、画像、動画）	$0.18	$0.18	$0.02	$0.02
	オーディオ入力	$0.54	$0.54	$0.05	$0.05
	テキスト出力（回答と推論）	$0.72	$0.72	なし	なし

柔軟/バッチ

モデル	タイプ	料金（100 万トークンあたり）<= 20 万入力トークン（Flex / バッチ）	料金（100 万トークンあたり）> 20 万入力トークン（柔軟 / バッチ）
Gemini 2.5 Pro
	入力（テキスト、画像、動画、音声）	$0.625	$1.25
	テキスト出力（回答と推論）	$5	$7.5
Gemini 2.5 Pro コンピュータの使用 - プレビュー
	入力（テキスト、画像、動画、音声）	なし	なし
	テキスト出力（回答と推論）	なし	なし
Gemini 2.5 Flash
	入力（テキスト、画像、動画）	$0.15	$0.15
	オーディオ入力	$0.5	$0.5
	テキスト出力（回答と推論）	$1.25	$1.25

Gemini 2.5 Flash Image
	入力（テキスト、画像、動画）***	$0.15	なし
	テキスト出力（回答と推論）	$1.25	なし
	画像出力***	$15	なし
Gemini 2.5 Flash Live API
	100 万個の入力テキストトークン	なし	なし
	100 万個の入力音声トークン	なし	なし
	100 万個の入力動画/画像トークン	なし	なし
	100 万個の出力テキストトークン	なし	なし
	100 万個の出力音声トークン	なし	なし
Gemini 2.5 Flash Lite
	入力（テキスト、画像、動画）	$0.05	$0.05
	オーディオ入力	$0.15	$0.15
	テキスト出力（回答と推論）	$0.2	$0.2

機能	料金
Google 検索によるグラウンディング	Gemini 2.0 Flash、2.5 Flash、2.5 Flash-Lite には、1 日あたり 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。Gemini 2.5 Pro には、1 日あたり 10,000 件のグラウンディングされたプロンプトが追加料金なしで含まれています。これらの上限を超えるグラウンディングされたプロンプトは、1,000 件あたり 35 ドルで課金されます。グラウンディングされたプロンプトとは、Google 検索に対して 1 つ以上のクエリを行う Gemini に送信されたリクエストです&ast;&ast;。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングプロンプトが必要な場合は、Google のアカウント担当者にお問い合わせください。お客様は、グラウンディングされた検索結果とともに検索候補をお客様アプリケーションインターフェースに表示しないことを決定できます。ただし、これには代替料金が適用されます。この免除をリクエストするには、Google Cloud のアカウント担当者にお問い合わせください。
エンタープライズ向けウェブグラウンディング	1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブグラウンディングに対して 1 つ以上のクエリを実行します**。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングプロンプトが必要な場合は、担当のアカウントチームにお問い合わせください。お客様は、グラウンディングされた検索結果とともに検索候補をお客様アプリケーションインターフェースに表示しないことを決定できます。ただし、これには代替料金が適用されます。この免除をリクエストするには、Google Cloud のアカウント担当者にお問い合わせください。
データによるグラウンディング	1,000 リクエストあたり $2.5。
Google マップによるグラウンディング	1,000 件のグラウンディングされたプロンプトあたり$25。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、Google マップに対して少なくとも 1 回のクエリが行われるものです。

* クエリ入力コンテキストが 200, 000 トークンより長い場合、すべてのトークン（入力と出力）が長いコンテキストの料金で課金されます。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
** Google 検索によるグラウンディングと企業向けウェブグラウンディングは、プロンプトがウェブの結果を正常に返した場合（つまり、ウェブからのグラウンディングサポート URL を少なくとも 1 つ含む結果）にのみ課金されます。Gemini モデルの使用料金は別途適用されます。
*** 1024x1024 の画像は 1,290 トークンを消費します（1K 出力画像あたり $0.039）。画像あたりのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
**** コンピュータ使用の課金では Gemini 2.5 Pro SKU が使用されます。コンピュータ使用の費用を分割するには、課金タグを適用します。詳しくはこちらをご覧ください。

LiveAPI セッションのコンテキストウィンドウの課金について: セッションコンテキストウィンドウに存在するすべてのトークンに対して、ターンごとに課金されます。セッションコンテキストウィンドウには、新しいトークン（現在のターン）と、以前のターンから蓄積されたすべてのトークンが含まれます。つまり、過去のターンのトークンは再処理され、構成されたコンテキストウィンドウのサイズまで、新しいターンごとに考慮されます。「ターン」とは、ユーザー入力とモデルのレスポンスを 1 つにまとめたものです。
プロアクティブ音声モード: 有効にすると、LiveAPI がリッスンしている間、入力トークンが課金されます。出力トークンは、API が応答した場合にのみ課金されます。
音声文字変換が有効になっている場合、文字変換のために生成されたすべてのテキストトークンは、テキストトークン出力料金で課金されます。

Gemini 2.0

Gemini 2.0 の料金はトークン数に基づいて請求されます。リクエストを送信する前に、リクエスト内の入力トークンの数を計算するには、SDK トークナイザーまたは countTokens API を使用します。リクエストが 400 または 500 エラーで失敗した場合、使用されたトークンに対して料金は請求されません。

料金表の切り替えボタンを使用して、トークンベースの料金とモダリティベースの料金を比較します。

トークンベースの料金

モデル	タイプ	料金	Batch API を使用した場合の料金
Gemini 2.0 Flash
	100 万個の入力トークン	$0.15	$0.075
	100 万個の入力音声トークン	$1.00	$0.50
	100 万個の出力テキストトークン	$0.60	$0.30
	100 万トレーニングトークンでチューニング	$3.00
Gemini 2.0 Flash Image Generation
	100 万入力トークン	$0.15
	100 万個の入力音声トークン	$1.00
	100 万個の入力動画トークン	$3
	100 万個の出力テキストトークン	$0.60
	100 万個の出力画像トークン	$30.00
Gemini 2.0 Flash Live API
	100 万個の入力テキストトークン	$0.5
	100 万個の入力音声トークン	$3
	100 万個の入力動画/画像トークン	$3
	100 万個の出力テキストトークン	$2
	100 万個の出力音声トークン	$12
Gemini 2.0 Flash Lite
	100 万個の入力トークン	$0.075	$0.0375
	100 万個の入力音声トークン	$0.075	$0.0375
	100 万個の出力テキストトークン	$0.30	$0.15
	100 万トレーニングトークンでチューニング	$1.00
Google 検索によるグラウンディング	Gemini 2.0 Flash と 2.5 Flash では、1 日あたり合計 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。これらの上限を超えるグラウンディングされたプロンプトは、1,000 個あたり 35 ドルで課金されます。グラウンディングされたプロンプトとは、Google 検索* に対して 1 つ以上のクエリを行う Gemini に送信されるリクエストです。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、Google のアカウント担当者にお問い合わせください。お客様は、グラウンディングされた検索結果とともに検索候補をお客様アプリケーションインターフェースに表示しないことを決定できますが、これには代替料金が適用されます。この免除をリクエストするには、Google Cloud のアカウント担当者にお問い合わせください。
エンタープライズ向けウェブグラウンディング	1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブグラウンディングに対して 1 つ以上のクエリを実行するものです*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、Google のアカウント担当者にお問い合わせください。お客様は、グラウンディングされた検索結果とともに検索候補をお客様アプリケーションインターフェースに表示しないことを決定できますが、これには代替料金が適用されます。この免除をリクエストするには、Google Cloud のアカウント担当者にお問い合わせください。
データによるグラウンディング	2025 年 6 月 16 日より、1,000 リクエストあたり $2.5。
Google マップによるグラウンディング	Gemini モデルには、追加料金なしで利用できるグラウンディングされたプロンプトが多数含まれています。 Gemini Flash と Flash-Lite: 1 日あたり合計 1,500 件のグラウンディングプロンプト。 Gemini Pro: 1 日あたり 10,000 件のグラウンディングプロンプト。これらの上限を超えるグラウンディングされたプロンプトは、グラウンディングされたプロンプト 1,000 件あたり 25 ドルで課金されます。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、Google マップに対して少なくとも 1 回のクエリが行われるものです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、Google のアカウント担当者にお問い合わせください。

モダリティベースの料金

以下のモダリティの料金は、平均的なユースケースに基づいており、参考としてのみご利用ください。実際の請求はトークンのみに基づいて行われます。

4 文字で、空白を含めて約 1 テキストトークンになります。

1024x1024 の画像の場合、1290 トークンを消費します。画像あたりのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。

動画入力は、1 秒あたり 1 フレームのサンプルレートで、1 秒あたり 258 トークンを消費します。音声付き動画では、動画トークンと音声トークンの両方に対して課金されます。

音声入力は、タイムスタンプなしで 1 秒あたり 25 トークンを消費します。

モデル	タイプ	料金	Batch API を使用した場合の料金
Gemini 2.0 Flash
	入力テキスト（$/100 万文字）	$0.0375	$0.01875
	入力画像（$/画像）	$0.0001935	$0.00009675
	入力動画（$/秒）	$0.0000387	$0.00001935
	音声入力（$/秒）	$0.000025	$0.0000125
	出力テキスト（$/100 万文字）	$0.15	$0.075
Gemini 2.0 Flash Image Generation
	入力テキスト（$/100 万文字）	$0.0375
	入力画像（$/画像）	$0.0001935
	入力動画（$/秒）	$0.0000387
	音声入力（$/秒）	$0.000025
	出力テキスト（$/100 万文字）	$0.15
	出力画像（画像あたり）	$0.04
Gemini 2.0 Flash Lite
	入力テキスト（$/100 万文字）	$0.01875	$0.009375
	入力画像（$/画像）	$0.00009675	$0.000048375
	入力動画（$/秒）	$0.00001935	$0.000009675
	音声入力（$/秒）	$0.000001875	$0.000000938
	出力テキスト（$/100 万文字）	$0.075	$0.0375
Google 検索によるグラウンディング	Gemini 2.0 Flash と 2.5 Flash では、1 日あたり合計 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。これらの上限を超えるグラウンディングされたプロンプトは、1,000 個あたり 35 ドルで課金されます。グラウンディングされたプロンプトとは、Google 検索* に対して 1 つ以上のクエリを行う Gemini に送信されるリクエストです。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、Google のアカウント担当者にお問い合わせください。
エンタープライズ向けウェブグラウンディング	1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブグラウンディングに対して 1 つ以上のクエリを実行するものです*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、Google のアカウント担当者にお問い合わせください。

* 料金は米ドル（USD）で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* トレーニングトークンの数は、トレーニングデータセット内のトークンの合計数にエポック数を掛けて計算されます。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングと企業向けウェブグラウンディングは、プロンプトがウェブの結果を正常に返した場合（つまり、ウェブからのグラウンディングサポート URL を少なくとも 1 つ含む結果）にのみ課金されます。Gemini モデルの使用料金は別途適用されます。
* Gemini 2.0 Flash Live API: 音声（入力/出力）は 1 秒あたり 25 トークン、動画（入力）は 1 秒あたり 258 トークン。Gemini 2.0 Flash Live API がプレビュー版である間は、Google 検索によるグラウンディングは無料です。

LiveAPI セッションのコンテキストウィンドウの課金について: セッションコンテキストウィンドウに存在するすべてのトークンに対して、ターンごとに課金されます。セッションコンテキストウィンドウには、新しいトークン（現在のターン）と、以前のターンから蓄積されたすべてのトークンが含まれます。つまり、過去のターンのトークンは再処理され、構成されたコンテキストウィンドウのサイズまで、新しいターンごとに考慮されます。「ターン」とは、ユーザー入力とモデルのレスポンスを 1 つにまとめたものです。
音声文字変換が有効になっている場合、文字変換のために生成されたすべてのテキストトークンは、テキストトークン出力料金で課金されます。

Gemma

モデル	料金
Gemma 4 26B	入力: 100 万トークンあたり $0.15 出力: 100 万トークンあたり $0.60 キャッシュヒット: 100 万トークンあたり $0.015

Agent Platform モデルオプティマイザーの料金（試験運用版）*

Agent Platform Model Optimizer は、Gemini モデルのリクエストに対して単一のメタエンドポイントを提供することで、企業のお客様による Gemini の使用を簡素化します。このサービスを使用するお客様は、Flash、Pro、または特定のバージョンを使用するかどうかを指定する必要はありません。ユーザーは、好みを指定するために構成可能な設定（費用、品質、バランス）を指定するだけで済みます。Model Optimizer は、各クエリを最適なモデルに送信することで、タスクに適した適切なレベルのインテリジェンスを適用します。

Agent Platform Model Optimizer には動的料金設定が適用されます。つまり、トークンあたりの平均価格は、タスクを完了するために適用されるモデルのインテリジェンスレベルによって異なります。そのため、構成設定に基づく可能性の高いシナリオを示すために、以下の料金例が提供されています（以下の表を参照）。Model Optimizer SKU は、請求の適用に使用する購入単位として機能する 1 ドルの SKU です。モデルを使用した後も、使用量に基づいて請求されます。

5:1 の I/O 比率	例 1 chat bot	注: これらの範囲は保証されるものではなく、個々の顧客の結果は異なる場合があります。
お客様の好み	お客様の入力トークンが MO に送信される	お客様の出力トークンが MO に送信される	入力トークン 100 万個あたりの平均価格（高）	100 万トークンあたりの平均出力価格（高価格帯）	入力トークン 100 万個あたりの平均価格（低価格帯）	100 万トークンあたりの平均出力価格（低価格帯）
費用	10,000,000	2,000,000	$0.63	$2.50	$0.16	$0.63
バランス	10,000,000	2,000,000	$1.26	$5.00	$0.63	$2.50
品質	10,000,000	2,000,000	$1.89	$7.50	$1.26	$5.00

1:20 I/O 比率	例 2 コンテンツの生成
お客様の好み	お客様の入力トークンが MO に送信される	お客様の出力トークンが MO に送信される	入力トークン 100 万個あたりの平均価格（高）	100 万トークンあたりの平均出力価格（高価格帯）	入力トークン 100 万個あたりの平均価格（低価格帯）	100 万トークンあたりの平均出力価格（低価格帯）
費用	1,000,000	20,000,000	$0.63	$2.50	$0.16	$0.63
バランス	1,000,000	20,000,000	$1.26	$5.00	$0.63	$2.50
品質	1,000,000	20,000,000	$1.89	$7.50	$1.26	$5.00

* Model Optimizer は有料の試験運用版サービスであり、リクエストを Agent Platform 上の Gemini の試験運用版にルーティングする場合があります。

その他の Gemini モデル

Gemini 2.0 または Gemini 2.5 以外のすべての Gemini モデルは、文字数、画像、動画/音声の秒数などのモダリティに基づいて課金されます。テキスト入力は、入力（プロンプト）1,000 文字ごと、出力（レスポンス）1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。その結果、トークンあたり約 4 文字になります。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後で、1 セント（$0.01）未満の小数部分は、1 セントに切り上げられます。メディア入力は、画像ごと、または秒ごと（動画）に課金されます。リクエストが 400 または 500 エラーで失敗した場合、使用されたトークンは課金されません。

モデル	機能	タイプ	料金（=< 128,000 入力トークン）	料金（> 128,000 入力トークン）
Gemini 1.5 Flash	マルチモーダル	画像入力動画入力テキスト入力音声入力	$0.00002 / 画像 $0.00002 / 秒 $0.00001875 / 1,000 文字 $0.000002 / 秒	$0.00004 / 画像 $0.00004 / 秒 $0.0000375 / 1,000 文字 $0.000004 / 秒
		テキスト出力	$0.000075 / 1,000 文字	$0.00015 / 1,000 文字
	チューニング*	トレーニングトークン	$8 / 100 万トークン
Gemini 1.5 Pro	マルチモーダル	画像入力動画入力テキスト入力音声入力	$0.00032875 / 画像 $0.00032875 / 秒 $0.0003125 / 1,000 文字 $0.00003125 / 秒	$0.0006575 / 画像 $0.0006575 / 秒 $0.000625 / 1,000 文字 $0.0000625 / 秒
		テキスト出力	$0.00125 / 1,000 文字	$0.0025 / 1,000 文字
	チューニング*	トレーニングトークン	$80 / 100 万トークン
Gemini 1.0 Pro	マルチモーダル	画像入力動画入力テキスト入力	$0.0025 / 画像 $0.002 / 秒 $0.000125 / 1,000 文字
Gemini 1.0 Pro		テキスト出力	$0.000375 / 1k 文字
Google 検索によるグラウンディング	テキスト	1,000 件のグラウンディングされたプロンプトあたり 35 ドル。グラウンディングされたプロンプトとは、Google 検索に対して 1 つ以上のクエリを行う Gemini に送信されるリクエストです*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングプロンプトが必要な場合は、担当のアカウントチームにお問い合わせください。
エンタープライズ向けウェブグラウンディング	テキスト	1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けウェブグラウンディング* に対して 1 つ以上のクエリを行います。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングプロンプトが必要な場合は、担当のアカウントチームにお問い合わせください。
データによるグラウンディング	テキスト	2025 年 6 月 16 日より、リクエスト 1,000 件あたり $2.5。

* 料金は米ドル（USD）で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* クエリのコンテキストが 128K より長い場合、すべてのトークンが長いコンテキストの料金で課金されます。
* Gemini モデルはバッチモードで 50% 割引で利用できます。
* Gemini 1.0 Pro は最大 32,000 のコンテキストウィンドウのみをサポートします。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングと企業向けウェブグラウンディングは、プロンプトがウェブの結果を正常に返した場合（つまり、ウェブからのグラウンディングサポート URL を少なくとも 1 つ含む結果）にのみ課金されます。Gemini モデルの使用料は別途適用されます。

Imagen

Agent Platform 上の Imagen では、テキストプロンプトを送信することで、新しい画像の生成や画像の編集をしたり、またマスク領域を定義して画像の一部を編集したりできます。この他にも多くの機能を利用できます。

モデル	機能	説明	入力	出力	料金
Imagen 4 Ultra	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.06
Imagen 4	アップスケーリング	生成された画像の解像度を 2K、3K、4K に上げる	画像	画像	画像 1 枚あたり $0.06
Imagen 4	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.04
Imagen 4 Fast	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.02
Imagen 3	画像生成	画像を生成画像を編集画像をカスタマイズ	テキストプロンプト	画像	画像 1 枚あたり $0.04
Imagen 3 Fast	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.02
Imagen 2、Imagen 1	画像生成	画像を生成する	テキストプロンプト	画像	画像 1 枚あたり $0.020
Imagen 2、Imagen 1	画像編集	マスクなしまたはマスクを使用して画像を編集する	画像 / テキストプロンプト	画像	画像 1 枚あたり $0.020
Imagen 1	アップスケーリング	生成された画像の解像度を 2K と 4K に上げる	画像	画像	画像 1 枚あたり $0.003
Imagen 1	ファインチューニング	ユーザーが提供した「テーマ」を Imagen のプロンプトとして使用できるようにする（few shot training）	テキスト識別子と 4-8 枚の画像を含めたテーマ	ファインチューニングされたモデル（ユーザーが提供したテーマでのトレーニング後）	1 ノード時間あたりの $（Agent Platform カスタムトレーニング料金）
Imagen	画像キャプション	画像に短い / 長いテキストキャプションを生成	画像	テキストキャプション	$0.0015 / 画像
Imagen	Visual Q&A	画像に関連した質問に対し回答を提供	画像 / テキストプロンプト	テキスト回答	$0.0015 / 画像
Imagen	プロダクトの再コンテキスト化	新しいシーンで商品を再考	同じ商品の画像 1 ～ 3 枚と、希望するシーンを説明するテキストプロンプト	画像	画像 1 枚あたり $0.12
	バーチャルで試着	さまざまな服を着た人物の画像を作成する	人物の画像 1 枚と衣料品の画像 1 枚	画像	画像 1 枚あたり $0.06

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

Veo

Veo は、現実世界の物理法則や人間の動きや表情のニュアンスに対する理解が向上し、幅広いテーマやスタイルで非常に高品質な動画を作成します。

モデル	機能	説明	入力	出力	出力解像度	料金
Veo 3.1	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音付きの高品質な動画を生成	テキスト/画像プロンプト	動画 + 音声	720p、1080p	$0.40/秒
	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音付きの高品質な動画を生成	テキスト/画像プロンプト	動画 + 音声	4k	$0.60/秒
	動画生成	テキストプロンプトまたは参照画像から高品質の動画を生成	テキスト/画像プロンプト	動画	720p、1080p	$0.20/秒
	動画生成	テキストプロンプトまたは参照画像から高品質の動画を生成	テキスト/画像プロンプト	動画	4k	$0.40/秒
Veo 3.1 Fast	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音を含む動画をすばやく生成	テキスト/画像プロンプト	動画 + 音声	720p	$0.10/秒
					1080p	$0.12/秒
					4k	$0.30/秒
	動画生成	テキストプロンプトまたは参照画像から動画をより速く生成	テキスト/画像プロンプト	動画	720p	$0.08/秒
					1080p	$0.10/秒
					4k	$0.25/秒
Veo 3.1 Lite	動画と音声の生成	テキストプロンプトまたは参照画像から、音声/効果音を同期させた動画を最速で生成	テキスト/画像プロンプト	動画 + 音声	720p	$0.05/秒
	動画と音声の生成	テキストプロンプトまたは参照画像から、音声/効果音を同期させた動画を最速で生成	テキスト/画像プロンプト	動画 + 音声	1080p	$0.08/秒
	動画生成	テキストプロンプトまたは参照画像から最速で動画を生成	テキスト/画像プロンプト	動画	720p	$0.03/秒
	動画生成	テキストプロンプトまたは参照画像から最速で動画を生成	テキスト/画像プロンプト	動画	1080p	$0.05/秒
Veo 3	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音付きの高品質な動画を生成	テキスト/画像プロンプト	動画 + 音声	720p、1080p	$0.40/秒
Veo 3	動画生成	テキストプロンプトまたは参照画像から高品質の動画を生成	テキスト/画像プロンプト	動画	720p、1080p	$0.20/秒
Veo 3 Fast	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音を含む動画をすばやく生成	テキスト/画像プロンプト	動画 + 音声	720p	$0.10/秒
	動画と音声の生成	テキストプロンプトまたは参照画像から、同期された音声/効果音を含む動画をすばやく生成	テキスト/画像プロンプト	動画 + 音声	1080p	$0.12/秒
	動画生成	テキストプロンプトまたは参照画像から動画をより速く生成	テキスト/画像プロンプト	動画	720p	$0.08/秒
	動画生成	テキストプロンプトまたは参照画像から動画をより速く生成	テキスト/画像プロンプト	動画	1080p	$0.10/秒
Veo 2	動画生成	テキストプロンプトまたは参照画像から動画を生成	テキスト/画像プロンプト	動画	720p	$0.50/秒
Veo 2	高度な管理機能	開始フレームと終了フレームの補間による動画生成、生成された動画の拡張、カメラ制御の適用	テキスト/画像/動画プロンプト	動画	720p	$0.50/秒

Lyria

Lyria モデルファミリーは、高品質の音楽生成を提供します。これは、ニュアンスのある出力が重要な、洗練された作曲や詳細なクリエイティブな探求に最適です。

モデル	機能	説明	入力	出力	料金
Lyria 3 Pro	フルレングスの音楽生成	Lyria 3 Pro は、テキストや画像などのマルチモーダル入力からフルレングスの楽曲を生成します	テキスト、画像	曲全体	3 分までのフルソング 1 曲あたり $0.08
Lyria 3	30 秒のミュージッククリップを生成	Lyria 3 は、テキストまたは画像プロンプトから高忠実度の 30 秒の音声クリップを生成します	テキスト、画像	30 秒のミュージッククリップ	30 秒の曲 1 曲あたり $0.04
Lyria 2	音楽生成	テキストプロンプトから音楽を生成する	テキストプロンプト	音楽	30 秒あたり $0.06

AI アプリケーションのエンベディング費用を把握する

モデル	型	リージョン	入力トークン 1,000 個あたりの料金
Gemini エンベディング	入力	グローバル	オンラインリクエスト: $0.00015 バッチリクエスト: $0.00012
Gemini エンベディング	出力	グローバル	オンラインリクエスト: 無料バッチリクエスト: 無料

モデル	型	リージョン	1,000 文字あたりの料金
テキストのエンベディング（Gemini エンベディングを除く）	入力	グローバル	オンラインリクエスト: $0.000025 バッチリクエスト: $0.00002
テキストのエンベディング（Gemini エンベディングを除く）	出力	グローバル	オンラインリクエスト: 無料バッチリクエスト: 無料

マルチモーダルエンベディング

モデル	タイプ	説明	料金
Gemini Embedding 2 （統合マルチモーダル、プレビュー）	入力テキスト（100 万トークンあたりの料金）	テキストを入力としてエンベディングを生成	$0.2
	入力画像（$/画像）	画像を入力としてエンベディングを生成	$0.00012
	入力動画（フレームあたり）	動画を入力としてエンベディングを生成	$0.00079
	音声入力（$/秒）	音声を入力としてエンベディングを生成	$0.00016

*出力トークンは無料です。

モデル	機能	説明	入力	出力	料金
multimodalembedding	マルチモーダルのエンベディング: テキスト	テキストを入力としてエンベディングを生成	テキスト	エンベディング	$0.0002 / 入力 1,000 文字
	マルチモーダルのエンベディング: 画像	画像を入力としてエンベディングを生成	画像	エンベディング	$0.0001 / 画像入力
	マルチモーダルのエンベディング: 動画プラス	Video Plus	動画	エンベディング（動画 1 分あたり最大 15 個）	動画 1 秒あたり $0.0020
	マルチモーダルのエンベディング: 動画（標準）	動画標準	動画	エンベディング（動画 1 分あたり最大 8 個）	動画 1 秒あたり $0.0010
	マルチモーダルのエンベディング: 動画の基本	動画の基本	動画	エンベディング（動画 1 分あたり最大 4 つのエンベディング）	動画 1 秒あたり $0.0005

オープンソースモデル	タイプ	入力トークン 1,000 個あたりの料金
multilingual-e5-small	入力: 出力: バッチ入力: バッチ出力:	オンラインリクエスト: $0.000015 オンラインリクエスト: 無料バッチリクエスト: $0.0000075 バッチリクエスト: 無料
multilingual-e5-large	入力: 出力: バッチ入力: バッチ出力:	オンラインリクエスト: $0.000025 オンラインリクエスト: 無料バッチリクエスト: $0.0000125 バッチリクエスト: 無料

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

Agent Platform のコード補完の料金

Agent Platform における生成 AI の利用では、入力（プロンプト）1,000 文字ごと、出力（レスポンス）1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後で、1 セント（$0.01）未満の小数部分は、1 セントに切り上げられます。

モデル	型	リージョン	1,000 文字あたりの料金
コード補完用 Codey	入力	グローバル	オンラインリクエスト: $0.00025
コード補完用 Codey	出力	グローバル	オンラインリクエスト: $0.0005

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

翻訳（テキスト）

Agent Platform API と翻訳 LLM を使用してテキストを翻訳します。LLM による翻訳は、従来の翻訳モデルよりも流暢で人間が話しているように聞こえる傾向がありますが、言語サポートはより限定的です（詳細）。

モデル	メソッド	用途	100 万文字あたりの料金
LLM	テキスト翻訳^*	1 か月あたりの入力文字数	$10/100 万文字^*
	テキスト翻訳^*	1 か月あたりの出力文字数	$10/100 万文字^*
	翻訳 LLM 002	テキスト翻訳^*	1 か月あたりの入力文字数	$20/100 万文字^*
1 か月あたりの出力文字数		テキスト翻訳^*	$20/100 万文字^*

料金は米ドル（USD）で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
^*料金は、モデルで処理された文字数に基づきます。文字のカウントについての詳細は、課金対象の文字をご覧ください。

明示的なキャッシュ保存のコンテキストキャッシュストレージの料金

モデル	機能	タイプ	料金（100 万トークンあたり）入力トークン 20 万個以下	料金（100 万トークンあたり） > 20 万入力トークン
Gemini 3.1 Pro	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$4.5（/M トークン/時間）	$4.5（/M トークン/時間）
Gemini 3 Flash	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$1（/100 万トークン/時間）	$1（/100 万トークン/時間）
Gemini 3.1 Flash Lite	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$1（/100 万トークン/時間）	$1（/100 万トークン/時間）
Gemini 3 Pro	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$4.5（/M トークン/時間）	$4.5（/M トークン/時間）
Gemini 2.5 Pro	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$4.5（/M トークン/時間）	$4.5（/M トークン/時間）
Gemini 2.5 Flash	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$1（/100 万トークン/時間）	$1（/100 万トークン/時間）
Gemini 2.5 Flash Lite	コンテキストキャッシュストレージ	入力（テキスト、画像、動画、音声）	$1（/100 万トークン/時間）	$1（/100 万トークン/時間）

Gemini 2.0 モデル

トークンベースの料金

モデル	タイプ	ストレージ（M トークン時間）	料金
Gemini 2.0 Flash
	100 万個の入力トークン	$1.00	$0.0375
	100 万個の入力音声トークン	$1.00	$0.25
	100 万個の出力テキストトークン	なし	なし
Gemini 2.0 Flash Lite
	100 万個の入力トークン	$1.00	$0.01875
	100 万個の入力音声トークン	$1.00	$0.01875
	100 万個の出力テキストトークン	なし	なし

モダリティベースの料金

4 文字で、空白を含めて約 1 テキストトークンになります。

音声入力は、タイムスタンプなしで 1 秒あたり 25 トークンを消費します。

モデル	タイプ	ストレージ（モダリティ時間）	料金
Gemini 2.0 Flash
	入力テキスト（$/100 万文字）	$0.25	$0.009375
	入力画像（$/画像）	$0.00129	$0.000048375
	入力動画（$/秒）	$0.000258	$0.000009675
	音声入力（$/秒）	$0.000025	$0.00000625
	出力テキスト（$/100 万文字）	なし	なし
Gemini 2.0 Flash Lite
	入力テキスト（$/100 万文字）	$0.25	$0.0046875
	入力画像（$/画像）	$0.00129	$0.0000241875
	入力動画（$/秒）	$0.000258	$0.000009675
	音声入力（$/秒）	$0.000258	$0.0000048375
	出力テキスト（$/100 万文字）	なし	なし
Google 検索によるグラウンディング	Gemini 2.0 Flash には、1 日あたり最大 1,500 件のグラウンディングされたリクエストが追加料金なしで含まれています。1 日あたり 1,500 件を超えるグラウンディングされたリクエストは、1,000 件あたり 35 ドルで課金されます（1 日あたり最大 100 万件）。 1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウントチームにお問い合わせください。お客様は、グラウンディングされた検索結果とともに検索候補をお客様アプリケーションインターフェースに表示しないことを決定できますが、これには代替料金が適用されます。この免除をリクエストするには、Google Cloud のアカウント担当者にお問い合わせください。
エンタープライズ向けウェブグラウンディング	2025 年 5 月 5 日より、リクエスト 1,000 件あたり $45（1 日あたり最大 100 万件のリクエスト）。 1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウントチームにお問い合わせください。お客様は、グラウンディングされた検索結果とともに検索候補をお客様アプリケーションインターフェースに表示しないことを決定できますが、これには代替料金が適用されます。この免除をリクエストするには、Google Cloud のアカウント担当者にお問い合わせください。

* 料金は米ドル（USD）で表示しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングは、ウェブからグラウンディングサポート URL を 1 つ以上含む結果を返すリクエストに対してのみ課金されます。標準の Gemini モデルの使用料金も適用されます。

プロビジョンドスループット

プロビジョンドスループットは、生成 AI のニーズに合わせてスループットを確保し、生成 AI スケールユニット（GSU）を介して取引されます。各 GSU で提供されるスループットについて詳しくは、こちらをご覧ください。オンライン見積もりツールはこちらからご利用いただけます。

期間	GSU あたりの料金	1 日あたり
1 週間のコミットメント	$1,200（グローバル） $1,320（グローバル以外）*	1 週間
1 か月契約	$2,700（グローバル） $2,970（グローバル以外）*	月
3 か月契約	$2,400（グローバル） $2,640（グローバル以外）*	月
1 年契約	$2,000（グローバル） $2,200（グローバル以外）*	月

* グローバル以外のエンドポイントの場合、一般提供版の Gemini 3 以降のモデルファミリーの料金は 2026 年 7 月 1 日に有効になります。2026 年 7 月 1 日までは、グローバルエンドポイントの料金が非グローバルエンドポイントに適用されます。

料金計算の例

ユーザーは、gemini-2.0-flash を使用して、1,000 個のテキストトークンと 500 個の音声トークンの入力を含むクエリの 1 秒あたり 10 件の秒間クエリ数（QPS）をサポートし、300 個のテキストトークンの出力を受け取ることができるようにする必要があります。

スループットとバーンダウン率の表を使用すると、gemini-2.0-flash の場合、入力テキストトークンのバーンダウン率は 1 トークン、入力音声トークンのバーンダウン率は 7 トークン、出力テキストトークンのバーンダウン率は 4 トークンであることがわかります。

ユーザーの入力トークンの合計数は、1,000*（入力テキストトークンあたり 1 トークン）+ 500*（入力音声トークンあたり 7 トークン）= 4,500 個のバーンダウン調整済み入力トークンです。ユーザーの出力トークンの合計は 300 *（出力テキストトークンあたり 4 トークン）= 1,200 個のバーンダウン調整済み出力トークンです。これらを合計すると、入力トークン（バーンダウン調整後）4,500 個 + 出力トークン（バーンダウン調整後）1,200 個 = クエリあたりの合計トークン数 5,700 個となります。

クエリあたりの合計トークン数に QPS を掛けると、クエリあたりの合計トークン数 5,700 個 × 10 QPS = 1 秒あたりの合計トークン数 57,000 個となります。

これを GSU あたりの 1 秒あたりの合計スループットで割ると、1 秒あたりの合計トークン数 57,000 ÷ GSU あたりの 1 秒あたりのスループット 3,360 = 16.96 GSU となります。このモデルの最小 GSU 購入単位は 1 なので、ユーザーは 17 GSU を購入する必要があります。

このスループットを 1 週間維持する場合、費用は 1,200 ドル * 17 GSU = 20,400 ドル / 週となります。このスループットを 1 か月維持する場合、費用は $2,700 × 17 GSU = 月額 $45,900 となります。このスループットを 3 か月間維持する場合、費用は 1 か月あたり $2,400 * 17 GSU = $40,800 となります。最後に、このスループットを 1 年間維持する場合、費用は 1 か月あたり $2,000 * 17 GSU = $34,000 となります。

モデルのチューニング

モデルのチューニングは、大規模なモデルをタスクに合わせてカスタマイズする効果的な方法です。これは、モデルの品質と効率性を改善するための重要なステップです。モデルのチューニングには次の利点があります。

特定のタスクの品質が向上する
モデルの堅牢性が向上する
プロンプトが短くなるため、推論のレイテンシとコストが低減される

チューニングは、トレーニングトークン 100 万個ごとに課金されます。トレーニングトークンの数は、トレーニングデータセット内のトークンの合計数にエポック数を掛けて計算されます。Gemini 3 以降、チューニング済みモデルのエンドポイントの予測料金は、ベースモデルの 1.5 倍になります。以前の Gemini モデル（Gemini 2.5 以前）の予測料金は、ベースモデルと同じです。

モデル	タイプ	料金（100 万トレーニングトークンあたり）
Gemini 3.1 Flash Lite	教師ありファインチューニング	$3
Gemini 2.5 Pro	教師ありファインチューニング	$25
Gemini 2.5 Flash	教師ありファインチューニングプリファレンスチューニング	$5
Gemini 2.5 Flash Lite	教師ありファインチューニングプリファレンスチューニング	$1.5
Gemma 3 1B IT	教師ありファインチューニング	$0.47
Gemma 3 4B IT	教師ありファインチューニング	$1.14
Gemma 3 12B IT	教師ありファインチューニング	$1.82
Gemma 3 27B IT	教師ありファインチューニング	$6.83
Medgemma 1.5 4B IT	教師ありファインチューニング	$1.14
Llama 3.1 8B	教師ありファインチューニング	$0.67
Llama 3.2 1B	教師ありファインチューニング	$0.28
Llama 3.2 3B	教師ありファインチューニング	$0.61
Llama 3.3 70B	教師ありファインチューニング	$6.72
Llama 4 Scout 17B 16E	教師ありファインチューニング	$5.77
Qwen 3 4B	教師ありファインチューニング	$1.35
Qwen 3 8B	教師ありファインチューニング	$4.18
Qwen 3 14B	教師ありファインチューニング	$8.46
Qwen 3 32B	教師ありファインチューニング	$6.57

* トレーニングトークンの数は、トレーニングデータセット内のトークンの合計数にエポック数を掛けて計算されます。
* Gemini 3 以降のモデル推論では、チューニング済みモデルのエンドポイントの予測料金はベースモデルの 1.5 倍になります。旧バージョンの Gemini モデルの予測料金は、ベースモデルと同じです。

文字数による課金の特殊なケース

モデル	タイプ	料金（100 万トレーニング文字あたり）
翻訳 LLM 002	教師ありファインチューニング	$6.25

Agent Platform のパートナーモデルの料金を比較

パートナーモデルは、Google パートナーが開発した生成 AI モデルの厳選されたリストです。パートナーモデルは、マネージド API として提供されます。詳細については、パートナーモデルの概要をご覧ください。以下のセクションでは、Google パートナーモデルの料金の詳細を記載しています。

Anthropic の Claude モデル

地域別の料金が設定されているモデル

グローバル

モデル	料金（100 万トークンあたり）=< 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン
Claude Opus 4.8	入力: $5.00 出力: $25.00 バッチ入力: $2.50 バッチ出力: $12.50 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュヒット: $0.50 5 分バッチキャッシュ書き込み: $3.125 1 時間バッチキャッシュ書き込み: $5.00 バッチキャッシュヒット: $0.25	入力: $5.00 出力: $25.00 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュヒット: $0.50
Claude Opus 4.7	入力: $5.00 出力: $25.00 バッチ入力: $2.50 バッチ出力: $12.50 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュヒット: $0.50 5 分バッチキャッシュ書き込み: $3.125 1 時間バッチキャッシュ書き込み: $5.00 バッチキャッシュヒット: $0.25	入力: $5.00 出力: $25.00 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュヒット: $0.50
Claude Opus 4.6	入力: $5.00 出力: $25.00 バッチ入力: $2.50 バッチ出力: $12.50 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュヒット: $0.50 5 分バッチキャッシュ書き込み: $3.125 1 時間バッチキャッシュ書き込み: $5.00 バッチキャッシュヒット: $0.25	入力: $5.00 出力: $25.00 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュヒット: $0.50
Claude Opus 4.5	入力: $5.00 出力: $25.00 バッチ入力: $2.50 バッチ出力: $12.50 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュヒット: $0.50 5 分バッチキャッシュ書き込み: $3.125 1 時間バッチキャッシュ書き込み: $5.00 バッチキャッシュヒット: $0.25
Claude Sonnet 4.6	入力: $3.00 出力: $15.00 バッチ入力: $1.50 バッチ出力: $7.50 5 分キャッシュ書き込み: $3.75 1 時間キャッシュ書き込み: $6.00 キャッシュヒット: $0.30 5 分バッチキャッシュ書き込み: $1.88 1 時間バッチキャッシュ書き込み: $3.00 バッチキャッシュヒット: $0.15	入力: $3.00 出力: $15.00 5 分キャッシュ書き込み: $3.75 1 時間キャッシュ書き込み: $6.00 キャッシュヒット: $0.30
Claude Sonnet 4.5	入力: $3.00 出力: $15.00 バッチ入力: $1.50 バッチ出力: $7.50 5 分キャッシュ書き込み: $3.75 1 時間キャッシュ書き込み: $6.00 キャッシュヒット: $0.30 5 分バッチキャッシュ書き込み: $1.88 1 時間バッチキャッシュ書き込み: $3.00 バッチキャッシュヒット: $0.15	入力: $6.00 出力: $22.50 5 分キャッシュ書き込み: $7.50 1 時間キャッシュ書き込み: $12.00 キャッシュヒット: $0.60
Claude Haiku 4.5	入力: $1.00 出力: $5.00 バッチ入力: $0.50 バッチ出力: $2.50 5 分キャッシュ書き込み: $1.25 1 時間キャッシュ書き込み: $2.00 キャッシュヒット: $0.10 5 分バッチキャッシュ書き込み: $0.625 1 時間バッチキャッシュ書き込み: $1.00 バッチキャッシュヒット: $0.05

米国（マルチリージョン）（us）

モデル	料金（100 万トークンあたり）=< 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン
Claude Opus 4.8	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275	入力: $5.50 出力: $27.50 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55
Claude Opus 4.7	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275	入力: $5.50 出力: $27.50 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55

EU マルチリージョン（eu）

モデル	料金（100 万トークンあたり）=< 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン
Claude Opus 4.8	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275	入力: $5.50 出力: $27.50 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55
Claude Opus 4.7	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275	入力: $5.50 出力: $27.50 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55

us-east5

モデル	料金（100 万トークンあたり）=< 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン
Claude Opus 4.6	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275	入力: $5.50 出力: $27.50 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55
Claude Opus 4.5	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275
Claude Sonnet 4.6	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 5 分バッチキャッシュ書き込み: $2.06 1 時間バッチキャッシュ書き込み: $3.30 バッチキャッシュヒット: $0.17 入力: $6.60 出力: $24.75 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュヒット: $0.66	入力: $3.30 出力: $16.50 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33
Claude Sonnet 4.5	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 5 分バッチキャッシュ書き込み: $2.06 1 時間バッチキャッシュ書き込み: $3.30 バッチキャッシュヒット: $0.17	入力: $6.60 出力: $24.75 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュヒット: $0.66
Claude Haiku 4.5	入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュ書き込み: $1.375 キャッシュヒット: $0.11 5 分バッチキャッシュ書き込み: $0.688 1 時間バッチキャッシュ書き込み: $1.10 バッチキャッシュヒット: $0.055

europe-west1

モデル	料金（100 万トークンあたり）=< 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン
Claude Opus 4.6	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275	入力: $5.50 出力: $27.50 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55
Claude Opus 4.5	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275
Claude Sonnet 4.6	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 5 分バッチキャッシュ書き込み: $2.06 1 時間バッチキャッシュ書き込み: $3.30 バッチキャッシュヒット: $0.17	入力: $3.30 出力: $16.50 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33
Claude Sonnet 4.5	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 5 分バッチキャッシュ書き込み: $2.06 1 時間バッチキャッシュ書き込み: $3.30 バッチキャッシュヒット: $0.17	入力: $6.60 出力: $24.75 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュヒット: $0.66
Claude Haiku 4.5	入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュヒット: $0.11 5 分バッチキャッシュ書き込み: $0.688 1 時間バッチキャッシュ書き込み: $1.10 バッチキャッシュヒット: $0.055

asia-southeast1

モデル	料金（100 万トークンあたり）=< 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン
Claude Opus 4.6	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275	入力: $5.50 出力: $27.50 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55
Claude Opus 4.5	入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュヒット: $0.55 5 分バッチキャッシュ書き込み: $3.438 1 時間バッチキャッシュ書き込み: $5.50 バッチキャッシュヒット: $0.275
Claude Sonnet 4.6	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 5 分バッチキャッシュ書き込み: $2.06 1 時間バッチキャッシュ書き込み: $3.30 バッチキャッシュヒット: $0.17	入力: $3.30 出力: $16.50 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33
Claude Sonnet 4.5	入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュヒット: $0.33 5 分バッチキャッシュ書き込み: $2.06 1 時間バッチキャッシュ書き込み: $3.30 バッチキャッシュヒット: $0.17	入力: $6.60 出力: $24.75 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュヒット: $0.66

asia-east1

モデル	料金（100 万トークンあたり）=< 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン
Claude Haiku 4.5	入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュヒット: $0.11 5 分バッチキャッシュ書き込み: $0.688 1 時間バッチキャッシュ書き込み: $1.10 バッチキャッシュヒット: $0.055

* クエリ入力コンテキストが 200, 000 トークン以上の場合、すべてのトークン（入力と出力）が長いコンテキストの料金で課金されます。

すべてのリージョンで料金が均一なモデル

モデル	料金（100 万トークンあたり）=< 20 万入力トークン	料金（100 万トークンあたり）> 200,000 入力トークン
Claude Opus 4.1	入力: $15 出力: $75 バッチ入力: $7.50 バッチ出力: $37.50 5 分キャッシュ書き込み: $18.75 1 時間キャッシュ書き込み: $30 キャッシュヒット: $1.50 5 分バッチキャッシュ書き込み: $9.375 1 時間バッチキャッシュ書き込み: $15.00 バッチキャッシュヒット: $0.75	なし
Claude Opus 4（非推奨）	入力: $15 出力: $75 バッチ入力: $7.50 バッチ出力: $37.50 5 分キャッシュ書き込み: $18.75 1 時間キャッシュ書き込み: $30 キャッシュヒット: $1.50 5 分バッチキャッシュ書き込み: $9.375 1 時間バッチキャッシュ書き込み: $15.00 バッチキャッシュヒット: $0.75	なし
Claude Sonnet 4（非推奨）	入力: $3 出力: $15 バッチ入力: $1.50 バッチ出力: $7.50 5 分キャッシュ書き込み: $3.75 1 時間キャッシュ書き込み: $6.00 キャッシュヒット: $0.30 5 分バッチキャッシュ書き込み: $1.875 1 時間バッチキャッシュ書き込み: $3.00 バッチキャッシュヒット: $0.15
Claude 3 Haiku（非推奨）	入力: $0.25 出力: $1.25 5 分キャッシュ書き込み: $0.30 1 時間キャッシュ書き込み: $0.50 キャッシュヒット: $0.03	なし
Claude 3.5 Haiku（非推奨）	入力: $0.80 出力: $4 バッチ入力: $0.40 バッチ出力: $2 5 分キャッシュ書き込み: $1 1 時間キャッシュ書き込み: $1.60 キャッシュヒット: $0.08 バッチキャッシュ書き込み: $0.50 バッチキャッシュヒット: $0.04	なし
Claude 3.7 Sonnet（非推奨）	入力: $3 出力: $15 バッチ入力: $1.50 バッチ出力: $7.50 キャッシュ書き込み: $3.75 キャッシュヒット: $0.30 バッチキャッシュ書き込み: $1.875 バッチキャッシュヒット: $0.15	なし

* クエリ入力コンテキストが 200, 000 トークン以上の場合、すべてのトークン（入力と出力）が長いコンテキストの料金で課金されます。

ツールの料金

ツール	料金
ウェブ検索リクエスト	1,000 回の検索あたり$10 サポート対象モデル: Claude Haiku 4.5、Claude Sonnet 4.5、Claude Sonnet 4.6、Claude Sonnet 4、Claude Opus 4.1、Claude Opus 4、Claude Opus 4.5、Claude Opus 4.6

* クエリ入力コンテキストが 200, 000 トークン以上の場合、すべてのトークン（入力と出力）が長いコンテキストの料金で課金されます。

xAI の Grok モデル

モデル	料金
Grok 4.20 の推論	入力: 100 万トークンあたり $1.25 出力: 100 万トークンあたり $2.50 キャッシュヒット: 100 万トークンあたり $0.20
Grok 4.20（非推論）	入力: 100 万トークンあたり $1.25 出力: 100 万トークンあたり $2.50 キャッシュヒット: 100 万トークンあたり $0.20
Grok 4.1 Fast Reasoning	入力: 100 万トークンあたり $0.20 出力: 100 万トークンあたり $0.50 キャッシュヒット: 100 万トークンあたり $0.05
Grok 4.1 Fast Non-Reasoning	入力: 100 万トークンあたり $0.20 出力: 100 万トークンあたり $0.50 キャッシュヒット: 100 万トークンあたり $0.05

Deepseek のモデル

モデル	料金
DeepSeek-V3.1	入力: 100 万トークンあたり $0.60 出力: 100 万トークンあたり $1.70 キャッシュヒット: 100 万トークンあたり $0.06 バッチ入力: 100 万トークンあたり $0.30 バッチ出力: 100 万トークンあたり $0.85
DeepSeek-V3.2	入力: 100 万トークンあたり $0.56 出力: 100 万トークンあたり $1.68 キャッシュヒット: 100 万トークンあたり $0.056 バッチ入力: 100 万トークンあたり $0.28 バッチ出力: 100 万トークンあたり $0.84
DeepSeek-R1（0528）	入力: 100 万トークンあたり $1.35 出力: 100 万トークンあたり $5.40 バッチ入力: 100 万トークンあたり $0.675 バッチ出力: 100 万トークンあたり $2.70
DeepSeek-OCR	入力: 100 万トークンあたり $0.30（または 1 ページあたり $0.0003）出力: 100 万トークンあたり $1.20（または 1 ページあたり $0.00012）

MiniMax のモデル

モデル	料金
MiniMax-M2	入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $1.20 キャッシュヒット: 100 万トークンあたり $0.03

Moonshot のモデル

モデル	料金
Kimi-K2-Thinking	入力: 100 万トークンあたり $0.60 出力: 100 万トークンあたり $2.50 キャッシュヒット: 100 万トークンあたり $0.06

Qwen のモデル

モデル	料金
Qwen3-Next-80B-Thinking	入力: 100 万トークンあたり $0.15 出力: 100 万トークンあたり $1.20
Qwen3-Next-80B-Instruct	入力: 100 万トークンあたり $0.15 出力: 100 万トークンあたり $1.20
Qwen3-Coder-480B-A35B-Instruct	入力: 100 万トークンあたり $0.22 出力: 100 万トークンあたり $1.80 キャッシュヒット: 100 万トークンあたり $0.022 バッチ入力: 100 万トークンあたり $0.11 バッチ出力: 100 万トークンあたり $0.90
Qwen3-235B-A22B-Instruct-2507	入力: 100 万トークンあたり $0.22 出力: 100 万トークンあたり $0.88 バッチ入力: 100 万トークンあたり $0.11 バッチ出力: 100 万トークンあたり $0.44

GLM のモデル

モデル	料金
GLM-4.7	入力: 100 万トークンあたり $0.60 出力: 100 万トークンあたり $2.20
GLM-5 *	入力: 100 万トークンあたり $1 出力: 100 万トークンあたり $3.2 キャッシュヒット: 100 万トークンあたり $0.1

OpenAI のモデル

モデル	料金
gpt-oss-120b	入力: 100 万トークンあたり $0.09 出力: 100 万トークンあたり $0.36 バッチ入力: 100 万トークンあたり $0.045 バッチ出力: 100 万トークンあたり $0.18
gpt-oss-20b	入力: 100 万トークンあたり $0.07 出力: 100 万トークンあたり $0.25 キャッシュヒット: 100 万トークンあたり $0.007 バッチ入力: 100 万トークンあたり $0.035 バッチ出力: 100 万トークンあたり $0.125

Meta の Llama モデル

モデル	料金
Llama 3.3 70B	入力: 100 万トークンあたり $0.72 出力: 100 万トークンあたり $0.72 バッチ入力: 100 万トークンあたり $0.36 バッチ出力: 100 万トークンあたり $0.36
Llama 4 Scout	入力: 100 万トークンあたり $0.25 出力: 100 万トークンあたり $0.70 バッチ入力: 100 万トークンあたり $0.125 バッチ出力: 100 万トークンあたり $0.35
Llama 4 Maverick	入力: 100 万トークンあたり $0.35 出力: 100 万トークンあたり $1.15 バッチ入力: 100 万トークンあたり $0.175 バッチ出力: 100 万トークンあたり $0.575

Mistral AI のモデル

モデル	料金
Mistral OCR（25.05）	入力: 100 万トークンあたり $0.0005（または 1 ページあたり $0.0005）出力: 100 万トークンあたり $0.0005（または 1 ページあたり $0.0005）
Mistral Medium 3	入力: 100 万トークンあたり $0.40 出力: 100 万トークンあたり $2.00
Mistral Small 3.1（25.03）	入力: 100 万トークンあたり $0.10 出力: 100 万トークンあたり $0.30
Codestral 2	入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $0.90

カスタム見積もりをリクエストする

Google Cloud の従量課金制では、使用したサービスに対してのみ料金が発生します。カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

お問い合わせ

Agent Platform での AI モデルの構築とデプロイの費用

Google モデル

Gemini 3

標準

優先度

柔軟/バッチ

エージェント

Gemini 2.5

標準

優先度

柔軟/バッチ

Gemini 2.0

トークンベースの料金

モダリティベースの料金

Gemma

Agent Platform モデル オプティマイザーの料金（試験運用版）*

その他の Gemini モデル

Imagen

Veo

Lyria

AI アプリケーションのエンベディング費用を把握する

マルチモーダル エンベディング

Agent Platform のコード補完の料金

翻訳（テキスト）

明示的なキャッシュ保存のコンテキスト キャッシュ ストレージの料金

Gemini 2.0 モデル

トークンベースの料金

モダリティベースの料金

プロビジョンド スループット

料金計算の例

モデルのチューニング

Agent Platform のパートナー モデルの料金を比較

Anthropic の Claude モデル

地域別の料金が設定されているモデル

グローバル

米国（マルチリージョン）（us）

EU マルチリージョン（eu）

us-east5

europe-west1

asia-southeast1

asia-east1

すべてのリージョンで料金が均一なモデル

ツールの料金

xAI の Grok モデル

Deepseek のモデル

MiniMax のモデル

Moonshot のモデル

Qwen のモデル

GLM のモデル

OpenAI のモデル

Meta の Llama モデル

Mistral AI のモデル

カスタム見積もりをリクエストする

Agent Platform モデルオプティマイザーの料金（試験運用版）*

マルチモーダルエンベディング

明示的なキャッシュ保存のコンテキストキャッシュストレージの料金

プロビジョンドスループット

Agent Platform のパートナーモデルの料金を比較