Vertex AI での AI モデルの構築とデプロイの費用
料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
課金されるのは、200 レスポンス コードを返すリクエストのみです。4xx や 5xx などの他のレスポンス コードを返すリクエストでは、入力や出力に対して料金は発生しません。
このページでは、Vertex AI での生成 AI の料金について説明します。ML Platform や MLOps サービスなど、Vertex AI のその他の料金については、Vertex AI の料金ページをご覧ください。
Google モデル
Gemini 3
| モデル | タイプ | 料金(100 万トークンあたり)<= 20 万入力トークン | 料金(100 万トークンあたり)> 200,000 入力トークン | 料金(100 万トークンあたり)<= 20 万個のキャッシュ入力トークン | 料金(100 万トークンあたり)> 20 万個のキャッシュ入力トークン | 料金(100 万トークンあたり)<= バッチ API で 20 万入力トークン | 料金(100 万トークンあたり)> バッチ API で 20 万入力トークン |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro プレビュー | |||||||
| 入力(テキスト、画像、動画、音声) | $2 | $4 | $0.2 | $0.4 | $1 | $2 | |
| テキスト出力(回答と推論) | $12 | $18 | なし | なし | $6 | $9 | |
| 画像出力** | $120 | なし | なし | なし | $60 | なし | |
| Google 検索によるグラウンディングとエンタープライズ向けウェブ グラウンディング |
Gemini 3 Pro には、追加料金なしで毎月 5,000 件の検索クエリが含まれています。 これらの上限を超える検索クエリは、1,000 件あたり$14 で課金されます。お客様が Gemini に送信したリクエストは、Google 検索(または Enterprise のウェブグラウンディング)に対する 1 つ以上のクエリにつながる可能性があります。検索クエリが実行されるたびに料金が発生します。課金は 2026 年 1 月 5 日に開始されます。 Google 検索を使用したグラウンディングまたはエンタープライズ向けウェブ グラウンディングによって提供される入力トークンは課金対象外です。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||||||
| Google マップによるグラウンディング |
Gemini 3 Pro には、追加料金なしで毎月 5,000 件の検索クエリが含まれています。 これらの上限を超える Maps クエリは、1,000 クエリあたり$14 で課金されます。お客様が Gemini に送信したリクエストにより、Google マップへのクエリが 1 つ以上生成されることがあります。実行された個々のクエリごとに課金されます。2026 年 1 月 5 日から課金が開始されます |
||||||
| データによるグラウンディング | 1,000 リクエストあたり $2.5。 | ||||||
* クエリ入力コンテキストが 200, 000 トークンを超える場合、すべてのトークン(入力と出力)に長いコンテキストの料金が適用されます。
** 1K(1024x1024)および 2K(2048x2048)の出力画像は、1, 120 の画像出力トークンを消費します。これは、生成された画像 1 枚あたり 0.134 ドルに相当します。4K(4096x4096)画像は 2, 000 個の画像出力トークンを消費し、これは生成された画像 1 枚あたり 0.24 ドルに相当します。
Gemini 2.5
| モデル | タイプ | 料金(100 万トークンあたり)<= 20 万入力トークン | 料金(100 万トークンあたり)> 200,000 入力トークン | 料金(100 万トークンあたり)<= 20 万個のキャッシュ入力トークン | 料金(100 万トークンあたり)> 20 万個のキャッシュ入力トークン | 料金(100 万トークンあたり)<= バッチ API で 20 万入力トークン | 料金(100 万トークンあたり)> バッチ API で 20 万入力トークン |
|---|---|---|---|---|---|---|---|
| Gemini 2.5 Pro | |||||||
| 入力(テキスト、画像、動画、音声) | $1.25 | 2.5 ドル | $0.125 | $0.250 | $0.625 | $1.25 | |
| テキスト出力(回答と推論) | $10 | $15 | なし | なし | $5 | $7.5 | |
| Gemini 2.5 Pro コンピュータの使用 - プレビュー |
|||||||
| 入力(テキスト、画像、動画、音声) | $1.25 | 2.5 ドル | なし | なし | なし | なし | |
| テキスト出力(回答と推論) | $10.00 | $15.00 | なし | なし | なし | なし | |
Gemini 2.5 Flash |
|||||||
| 入力(テキスト、画像、動画) | $0.30 | $0.30 | $0.030 | $0.030 | $0.15 | $0.15 | |
| オーディオ入力 | $1 | $1 | $0.100 | $0.100 | $0.5 | $0.5 | |
| テキスト出力(回答と推論) | $2.50 | $2.50 | なし | なし | $1.25 | $1.25 | |
| 画像出力*** | $30 | $30 | なし | なし | $15 | $15 | |
Gemini 2.5 Flash Live API |
|||||||
| 100 万個の入力テキスト トークン | $0.5 | $0.5 | なし | なし | なし | なし | |
| 100 万個の入力音声トークン | $3 | $3 | なし | なし | なし | なし | |
| 100 万個の入力動画/画像トークン | $3 | $3 | なし | なし | なし | なし | |
| 100 万個の出力テキスト トークン | $2 | $2 | なし | なし | なし | なし | |
| 100 万個の出力音声トークン | $12 | $12 | なし | なし | なし | なし | |
Gemini 2.5 Flash Lite |
|||||||
| 入力(テキスト、画像、動画) | $0.1 | $0.1 | $0.010 | $0.010 | $0.05 | $0.05 | |
| オーディオ入力 | $0.3 | $0.3 | $0.030 | $0.030 | $0.15 | $0.15 | |
| テキスト出力(回答と推論) | $0.4 | $0.4 | なし | なし | $0.2 | $0.2 | |
Google 検索によるグラウンディング |
Gemini 2.0 Flash、2.5 Flash、2.5 Flash-Lite には、1 日あたり 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。Gemini 2.5 Pro には、1 日あたり 10,000 件のグラウンディングされたプロンプトが追加料金なしで含まれています。 これらの上限を超えるグラウンディングされたプロンプトは、1,000 件あたり 35 ドルで課金されます。 グラウンディングされたプロンプトとは、Google 検索に対して 1 つ以上のクエリを行う Gemini に送信されるリクエストです**。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディング プロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||||||
エンタープライズ向けウェブ グラウンディング |
1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブ グラウンディングに対して 1 つ以上のクエリを実行します**。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディング プロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||||||
| データによるグラウンディング | 1,000 リクエストあたり $2.5。 | ||||||
| Google マップによるグラウンディング | 1,000 件のグラウンディングされたプロンプトあたり$25。 グラウンディングされたプロンプトとは、Google マップに対して 1 回以上のクエリを行うよう Gemini に送信されるリクエストです。 |
||||||
* クエリ入力コンテキストが 200, 000 トークンを超える場合、すべてのトークン(入力と出力)に長いコンテキストの料金が適用されます。
** Google 検索によるグラウンディングと企業向けウェブ グラウンディングは、プロンプトがウェブの結果を正常に返した場合(つまり、ウェブからのグラウンディング サポート URL を 1 つ以上含む結果)にのみ課金されます。Gemini モデルの使用料金は別途適用されます。
*** 1024x1024 の画像は 1290 トークンを消費します。画像あたりのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
**** コンピュータ使用の課金では Gemini 2.5 Pro SKU が使用されます。コンピュータ使用の費用を分割するには、課金タグを適用します。詳しくは、こちらをご覧ください。
- LiveAPI セッションのコンテキスト ウィンドウの課金について: セッション コンテキスト ウィンドウに存在するすべてのトークンに対して、ターンごとに課金されます。セッション コンテキスト ウィンドウには、新しいトークン(現在のターン)と、以前のターンから蓄積されたすべてのトークンが含まれます。つまり、過去のターンのトークンは再処理され、構成されたコンテキスト ウィンドウのサイズまで、新しいターンごとに考慮されます。「ターン」とは、ユーザーの入力とモデルのレスポンスを 1 つにまとめたものです。
- プロアクティブ音声モード: 有効にすると、LiveAPI がリッスンしている間、入力トークンが課金されます。出力トークンは、API が応答した場合にのみ課金されます。
- 音声文字変換が有効になっている場合、文字変換のために生成されたすべてのテキスト トークンは、テキスト トークン出力料金で課金されます。
Gemini 2.0
Gemini 2.0 はトークンに基づいて課金されます。リクエストを送信する前に、リクエスト内の入力トークンの数を計算するには、SDK トークン化ツールまたは countTokens API を使用します。 リクエストが 400 または 500 エラーで失敗した場合、使用されたトークンに対して料金は請求されません。
料金表の切り替えボタンを使用して、トークンベースの料金とモダリティベースの料金を比較します。
トークンベースの料金
| モデル | タイプ | 料金 | Batch API を使用した場合の料金 | ||
|---|---|---|---|---|---|
Gemini 2.0 Flash |
|||||
| 100 万個の入力トークン | $0.15 | $0.075 | |||
| 100 万個の入力音声トークン | $1.00 | $0.50 | |||
| 100 万個の出力テキスト トークン | $0.60 | $0.30 | |||
| 100 万トレーニング トークンでチューニング | $3.00 | ||||
Gemini 2.0 Flash Image Generation |
|||||
| 100 万個の入力トークン | $0.15 | ||||
| 100 万個の入力音声トークン | $1.00 | ||||
| 100 万個の入力動画トークン | $3 | ||||
| 100 万個の出力テキスト トークン | $0.60 | ||||
| 100 万個の出力画像トークン | $30.00 | ||||
Gemini 2.0 Flash Live API |
|||||
| 100 万個の入力テキスト トークン | $0.5 | ||||
| 100 万個の入力音声トークン | $3 | ||||
| 100 万個の入力動画/画像トークン | $3 | ||||
| 100 万個の出力テキスト トークン | $2 | ||||
| 100 万個の出力音声トークン | $12 | ||||
Gemini 2.0 Flash Lite |
|||||
| 100 万個の入力トークン | $0.075 | $0.0375 | |||
| 100 万個の入力音声トークン | $0.075 | $0.0375 | |||
| 100 万個の出力テキスト トークン | $0.30 | $0.15 | |||
| 100 万トレーニング トークンでチューニング | $1.00 | ||||
Google 検索によるグラウンディング |
Gemini 2.0 Flash と 2.5 Flash には、1 日あたり 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。 これらの上限を超えるグラウンディングされたプロンプトは、1,000 個あたり 35 ドルで課金されます。 グラウンディングされたプロンプトとは、Google 検索* に対して 1 つ以上のクエリを行うよう Gemini に送信されるリクエストです。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||||
エンタープライズ向けウェブ グラウンディング |
1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブ グラウンディングに対して 1 つ以上のクエリを実行するものです*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||||
| データによるグラウンディング | 2025 年 6 月 16 日より、1,000 リクエストあたり $2.5。 | ||||
Google マップによるグラウンディング |
Gemini モデルには、追加料金なしで利用できるグラウンディングされたプロンプトが多数含まれています。 これらの上限を超えるグラウンディングされたプロンプトは、グラウンディングされたプロンプト 1,000 件あたり 25 ドルで課金されます。 グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、Google マップに対して少なくとも 1 回のクエリが行われるものです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||||
モダリティベースの料金
以下のモダリティの料金は、参考として平均的なユースケースに基づいています。実際の請求はトークンのみに基づいて行われます。
- 4 文字で、空白を含めて約 1 テキストトークンになります。
- 1024x1024 の画像の場合、1290 トークンを消費します。画像あたりのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
- 動画入力は、1 秒あたり 1 フレームのサンプルレートで、1 秒あたり 258 トークンを消費します。音声付き動画では、動画トークンと音声トークンの両方に対して課金されます。
- 音声入力は、タイムスタンプなしで 1 秒あたり 25 トークンを消費します。
| モデル | タイプ | 料金 | Batch API を使用した場合の料金 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 入力テキスト($/100 万文字) | $0.0375 | $0.01875 | |
| 入力画像($/画像) | $0.0001935 | $0.00009675 | |
| 入力動画($/秒) | $0.0000387 | $0.00001935 | |
| 音声入力($/秒) | $0.000025 | $0.0000125 | |
| 出力テキスト($/100 万文字) | $0.15 | $0.075 | |
Gemini 2.0 Flash Image Generation |
|||
| 入力テキスト($/100 万文字) | $0.0375 | ||
| 入力画像($/画像) | $0.0001935 | ||
| 入力動画($/秒) | $0.0000387 | ||
| 音声入力($/秒) | $0.000025 | ||
| 出力テキスト($/100 万文字) | $0.15 | ||
| 出力画像(画像あたり) | $0.04 | ||
Gemini 2.0 Flash Lite |
|||
| 入力テキスト($/100 万文字) | $0.01875 | $0.009375 | |
| 入力画像($/画像) | $0.00009675 | $0.000048375 | |
| 入力動画($/秒) | $0.00001935 | $0.000009675 | |
| 音声入力($/秒) | $0.000001875 | $0.000000938 | |
| 出力テキスト($/100 万文字) | $0.075 | $0.0375 | |
Google 検索によるグラウンディング |
Gemini 2.0 Flash と 2.5 Flash には、1 日あたり 1,500 件のグラウンディングされたプロンプトが追加料金なしで含まれています。 これらの上限を超えるグラウンディングされたプロンプトは、1,000 個あたり 35 ドルで課金されます。 グラウンディングされたプロンプトとは、Google 検索* に対して 1 つ以上のクエリを行うよう Gemini に送信されるリクエストです。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||
エンタープライズ向けウェブ グラウンディング |
1,000 件のグラウンディングされたプロンプトあたり 45 ドル。グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブ グラウンディングに対して 1 つ以上のクエリを実行するものです*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディングされたプロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||
* 料金は米ドル(USD)で表示しています。
米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* トレーニング トークンの数は、トレーニング データセット内のトークンの合計数にエポック数を掛けて計算されます。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングと企業向けウェブ グラウンディングは、プロンプトがウェブの結果を正常に返した場合(つまり、ウェブからのグラウンディング サポート URL を少なくとも 1 つ含む結果)にのみ課金されます。Gemini モデルの使用料金は別途適用されます。
* Gemini 2.0 Flash Live API: 音声(入力/出力)は 1 秒あたり 25 トークン、動画(入力)は 1 秒あたり 258 トークン。Gemini 2.0 Flash Live API がプレビュー版である間は、Google 検索によるグラウンディングは無料です。
- LiveAPI セッションのコンテキスト ウィンドウの課金について: セッション コンテキスト ウィンドウに存在するすべてのトークンに対して、ターンごとに課金されます。セッション コンテキスト ウィンドウには、新しいトークン(現在のターン)と、以前のターンから蓄積されたすべてのトークンが含まれます。つまり、過去のターンのトークンは再処理され、構成されたコンテキスト ウィンドウのサイズまで、新しいターンごとに考慮されます。「ターン」とは、ユーザーの入力とモデルのレスポンスを 1 つにまとめたものです。
- 音声文字変換が有効になっている場合、文字変換のために生成されたすべてのテキスト トークンは、テキスト トークン出力料金で課金されます。
Vertex AI Model Optimizer の料金(試験運用版)*
Vertex AI Model Optimizer は、Gemini モデルのリクエストに対して単一のメタエンドポイントを提供することで、エンタープライズのお客様による Gemini の使用を簡素化します。このサービスを使用するお客様は、Flash、Pro、または特定のバージョンを使用するかどうかを指定する必要はありません。ユーザーは、好みを指定するために構成可能な設定(費用、品質、バランス)を指定するだけで済みます。Model Optimizer は、各クエリを最適なモデルに送信することで、タスクに適した適切なレベルのインテリジェンスを適用します。
Vertex AI Model Optimizer では、動的料金が適用されます。つまり、トークンあたりの平均価格は、タスクを完了するために適用されるモデルのインテリジェンス レベルによって異なります。そのため、構成設定に基づく可能性の高いシナリオを示すために、以下の料金例が提供されています(以下の表を参照)。Model Optimizer の SKU は、請求の適用単位として機能する 1 ドルの SKU です。モデルを使用した後も、使用量に基づいて請求されます。
| 5:1 の I/O 比率 | 例 1 chat bot |
注: これらの範囲は保証されるものではなく、お客様ごとに結果が異なる場合があります | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| お客様の好み | お客様の入力トークンが MO に送信される | お客様の出力トークンが MO に送信される | 100 万トークンあたりの平均入力価格(高価格帯) | 100 万トークンあたりの平均出力価格(高価格帯) | 100 万トークンあたりの平均入力料金(低範囲) | 100 万トークンあたりの平均出力価格(低価格帯) | |||||
| 費用 | 10,000,000 | 2,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
| バランス | 10,000,000 | 2,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
| 品質 | 10,000,000 | 2,000,000 | $1.89 | $7.50 | $1.26 | $5.00 | |||||
| 1:20 I/O 比率 | 例 2 コンテンツの生成 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| お客様の好み | お客様の入力トークンが MO に送信される | お客様の出力トークンが MO に送信される | 100 万トークンあたりの平均入力価格(高価格帯) | 100 万トークンあたりの平均出力価格(高価格帯) | 100 万トークンあたりの平均入力料金(低範囲) | 100 万トークンあたりの平均出力価格(低価格帯) | |||||
| 費用 | 1,000,000 | 20,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
| バランス | 1,000,000 | 20,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
| 品質 | 1,000,000 | 20,000,000 | $1.89 | $7.50 | $1.26 | $5.00 | |||||
その他の Gemini モデル
Gemini 2.0 または Gemini 2.5 以外のすべての Gemini モデルは、文字数、画像、動画/音声の秒数などのモダリティに基づいて課金されます。テキスト入力は、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。 文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。その結果、トークンあたり約 4 文字になります。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後で、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。メディア入力は、画像ごと、または秒ごと(動画)に課金されます。リクエストが 400 または 500 エラーで失敗した場合、使用されたトークンは課金されません。
| モデル | 機能 | タイプ | 料金 (=< 128,000 入力トークン) |
料金 (> 128,000 入力トークン) |
||
|---|---|---|---|---|---|---|
| Gemini 1.5 Flash | マルチモーダル | 画像入力 動画入力 テキスト入力 音声入力 |
$0.00002 / 画像 $0.00002 / 秒 $0.00001875 / 1,000 文字 $0.000002 / 秒 |
$0.00004 / 画像 $0.00004 / 秒 $0.0000375 / 1,000 文字 $0.000004 / 秒 |
||
| テキスト出力 | $0.000075 / 1,000 文字 | $0.00015 / 1,000 文字 | ||||
| チューニング* | トレーニング トークン | $8 / 100 万トークン | ||||
| Gemini 1.5 Pro | マルチモーダル | 画像入力 動画入力 テキスト入力 音声入力 |
$0.00032875 / 画像 $0.00032875 / 秒 $0.0003125 / 1,000 文字 $0.00003125 / 秒 |
$0.0006575 / 画像 $0.0006575 / 秒 $0.000625 / 1,000 文字 $0.0000625 / 秒 |
||
| テキスト出力 | $0.00125 / 1,000 文字 | $0.0025 / 1,000 文字 | ||||
| チューニング* | トレーニング トークン | $80 / 100 万トークン | ||||
| Gemini 1.0 Pro | マルチモーダル | 画像入力 動画入力 テキスト入力 |
$0.0025 / 画像 $0.002 / 秒 $0.000125 / 1,000 文字 |
|||
| テキスト出力 | $0.000375 / 1k 文字 | |||||
| Google 検索によるグラウンディング | テキスト | 1,000 件のグラウンディングされたプロンプトあたり 35 ドル。 グラウンディングされたプロンプトとは、Google 検索* に対して 1 つ以上のクエリを行う Gemini に送信されるリクエストです。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディング プロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||||
| エンタープライズ向けウェブ グラウンディング | テキスト | 1,000 件のグラウンディングされたプロンプトあたり 45 ドル。 グラウンディングされたプロンプトとは、Gemini に送信されるリクエストで、エンタープライズ向けのウェブ グラウンディングに対して 1 つ以上のクエリを実行します*。複数の検索クエリが Google 検索に送信された場合でも、グラウンディングされたプロンプトに対する料金は 1 回のみです。 1 日あたり 100 万件を超えるグラウンディング プロンプトが必要な場合は、アカウント チームにお問い合わせください。 |
||||
| データによるグラウンディング | テキスト | 2025 年 6 月 16 日より、1,000 リクエストあたり $2.5。 |
||||
* 料金は米ドル(USD)で表示しています。
米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* クエリのコンテキストが 128K より長い場合、すべてのトークンが長いコンテキストの料金で課金されます。
* Gemini モデルはバッチモードで 50% 割引で利用できます。
* Gemini 1.0 Pro は最大 32,000 のコンテキスト ウィンドウのみをサポートします。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングと企業向けウェブ グラウンディングは、プロンプトがウェブの結果を正常に返した場合(つまり、ウェブからのグラウンディング サポート URL を 1 つ以上含む結果)にのみ課金されます。Gemini モデルの使用料は別途適用されます。
Imagen
Vertex AI の Imagen では、テキスト プロンプトを送信することで、新しい画像の生成や画像の編集をしたり、またマスク領域を定義して画像の一部を編集したりできます。この他にも多くの機能を利用できます。
| モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
|---|---|---|---|---|---|
| Imagen 4 Ultra | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.06 |
| Imagen 4 | アップスケーリング | 生成された画像の解像度を 2K、3K、4K に上げる | 画像 | 画像 | 画像 1 枚あたり $0.06 |
| Imagen 4 | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.04 |
| Imagen 4 Fast | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.02 |
| Imagen 3 | 画像生成 | 画像を生成 画像を編集 画像をカスタマイズ |
テキスト プロンプト | 画像 | 画像 1 枚あたり $0.04 |
| Imagen 3 Fast | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.02 |
| Imagen 2、Imagen 1 | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.020 |
| Imagen 2、Imagen 1 | 画像編集 | マスクなしまたはマスクを使用して画像を編集する | 画像 / テキスト プロンプト | 画像 | 画像 1 枚あたり $0.020 |
| Imagen 1 | アップスケーリング | 生成された画像の解像度を 2K と 4K に上げる | 画像 | 画像 | 画像 1 枚あたり $0.003 |
| Imagen 1 | ファインチューニング | ユーザーが提供した「テーマ」を Imagen のプロンプトとして使用できるようにする(few shot training) | テキスト識別子と 4-8 枚の画像を含めたテーマ | ファイン チューニングされたモデル(ユーザーが提供したテーマでのトレーニング後) | 1 ノード時間あたりの $(Vertex AI カスタム トレーニング料金) |
| Imagen | 画像キャプション | 画像に短い / 長いテキスト キャプションを生成 | 画像 | テキスト キャプション | $0.0015 / 画像 |
| Imagen | Visual Q&A | 画像に関連した質問に対し回答を提供 | 画像 / テキスト プロンプト | テキスト回答 | $0.0015 / 画像 |
| Imagen | プロダクトの再コンテキスト化 | 新しいシーンで製品を再考 | 同じ商品の画像 1 ~ 3 枚と、希望するシーンを説明するテキスト プロンプト | 画像 | 画像 1 枚あたり $0.12 |
| Vertex バーチャル試着 | さまざまな服を着た人物の画像を作成する | 人物の画像 1 枚と衣料品の画像 1 枚 | 画像 | 画像 1 枚あたり $0.06 |
料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
Veo
Veo は、現実世界の物理法則や人物の動作と表情のニュアンスに対する理解が向上し、幅広いテーマやスタイルで非常に高品質な動画を作成します。
| モデル | 機能 | 説明 | 入力 | 出力 | 出力解像度 | 料金 |
|---|---|---|---|---|---|---|
| Veo 3.1 | 動画と音声の生成 | テキスト プロンプトまたは参照画像から、同期された音声/効果音を含む高品質の動画を生成 | テキスト/画像プロンプト | 動画 + 音声 | 720p、1080p | $0.40/秒 |
| Veo 3.1 | 動画生成 | テキスト プロンプトまたは参照画像から高品質の動画を生成 | テキスト/画像プロンプト | 動画 | 720p、1080p | $0.20/秒 |
| Veo 3.1 Fast | 動画と音声の生成 | テキスト プロンプトまたは参照画像から、同期された音声/効果音を含む動画をより速く生成 | テキスト/画像プロンプト | 動画 + 音声 | 720p、1080p | $0.15/秒 |
| Veo 3.1 Fast | 動画生成 | テキスト プロンプトまたは参照画像から動画をより速く生成 | テキスト/画像プロンプト | 動画 | 720p、1080p | $0.10/秒 |
| Veo 3 | 動画と音声の生成 | テキスト プロンプトまたは参照画像から、同期された音声/効果音を含む高品質の動画を生成 | テキスト/画像プロンプト | 動画 + 音声 | 720p、1080p | $0.40/秒 |
| Veo 3 | 動画生成 | テキスト プロンプトまたは参照画像から高品質の動画を生成 | テキスト/画像プロンプト | 動画 | 720p、1080p | $0.20/秒 |
| Veo 3 Fast | 動画と音声の生成 | テキスト プロンプトまたは参照画像から、同期された音声/効果音を含む動画をより速く生成 | テキスト/画像プロンプト | 動画 + 音声 | 720p、1080p | $0.15/秒 |
| Veo 3 Fast | 動画生成 | テキスト プロンプトまたは参照画像から動画をより速く生成 | テキスト/画像プロンプト | 動画 | 720p、1080p | $0.10/秒 |
| Veo 2 | 動画生成 | テキスト プロンプトまたは参照画像から動画を生成 | テキスト/画像プロンプト | 動画 | 720p | $0.50/秒 |
| Veo 2 | 詳細設定 | 開始フレームと終了フレームの補間による動画生成、生成された動画の拡張、カメラ制御の適用 | テキスト/画像/動画プロンプト | 動画 | 720p | $0.50/秒 |
Lyria
Lyria 2 は、高品質のインストゥルメンタル音楽を生成します。ニュアンスのある出力が重要な、洗練された作曲や詳細なクリエイティブな探求に最適です。
| モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
|---|---|---|---|---|---|
| Lyria 2 | 音楽生成 | テキスト プロンプトから音楽を生成する | テキスト プロンプト | 音楽 | 30 秒あたり $0.06 |
AI アプリケーションのエンベディング費用を把握する
| モデル | 型 | リージョン | 1,000 入力トークンあたりの料金 |
|---|---|---|---|
| Gemini エンベディング | 入力 | グローバル |
|
| 出力 | グローバル |
|
| モデル | 型 | リージョン | 1,000 文字あたりの料金 |
|---|---|---|---|
| テキストのエンベディング (Gemini エンベディングを除く) |
入力 | グローバル |
|
| 出力 | グローバル |
|
| モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
|---|---|---|---|---|---|
| multimodalembedding | マルチモーダルのエンベディング: テキスト | テキストを入力としてエンベディングを生成 | テキスト | エンベディング | $0.0002 / 入力 1,000 文字 |
| マルチモーダルのエンベディング: 画像 | 画像を入力としてエンベディングを生成 | 画像 | エンベディング | $0.0001 / 画像入力 | |
| マルチモーダルのエンベディング: 動画プラス | 動画プラス | 動画 | エンベディング(動画 1 分あたり最大 15 個) | 動画 1 秒あたり $0.0020 | |
| マルチモーダルのエンベディング: 動画(標準) | 動画 標準 | 動画 | エンベディング(動画 1 分あたり最大 8 個) | 動画 1 秒あたり $0.0010 | |
| マルチモーダルのエンベディング: 動画の基本 | 動画の基本 | 動画 | エンベディング(動画 1 分あたり最大 4 つのエンベディング) | 動画 1 秒あたり $0.0005 |
| オープンソース モデル | タイプ | 1,000 入力トークンあたりの料金 |
|---|---|---|
| multilingual-e5-small | 入力: 出力: バッチ入力: バッチ出力: |
オンライン リクエスト: $0.000015 オンライン リクエスト: 無料 バッチ リクエスト: $0.0000075 バッチ リクエスト: 無料 |
| multilingual-e5-large | 入力: 出力: バッチ入力: バッチ出力: |
オンライン リクエスト: $0.000025 オンライン リクエスト: 無料 バッチ リクエスト: $0.0000125 バッチ リクエスト: 無料 |
料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
Vertex AI のコード補完の料金
Vertex AI における生成 AI の利用では、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後で、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。
| モデル | 型 | リージョン | 1,000 文字あたりの料金 |
|---|---|---|---|
| コード補完用 Codey | 入力 | グローバル |
|
| 出力 | グローバル |
|
料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
翻訳(テキスト)
Vertex AI API と翻訳 LLM を使用してテキストを翻訳します。LLM による翻訳は、従来の翻訳モデルよりも流暢で人間が話しているように聞こえる傾向がありますが、言語サポートはより限定的です(詳細)。
| モデル | メソッド | 用途 | 100 万文字あたりの料金 |
|---|---|---|---|
| LLM | テキスト 翻訳* | 1 か月あたりの入力文字数 |
$10/100 万文字* |
| 1 か月あたりの出力文字数 |
$10/100 万文字* |
料金は米ドル(USD)で表しています。米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
*料金は、モデルで処理された文字数に基づきます。文字のカウントについての詳細は、課金対象の文字をご覧ください。
明示的なキャッシュ保存のコンテキスト キャッシュ ストレージの料金
| モデル | 機能 | タイプ | 料金(100 万トークンあたり) <= 20 万入力トークン |
料金(100 万トークンあたり) > 20 万入力トークン |
|---|---|---|---|---|
| Gemini 3 Pro | コンテキスト キャッシュ ストレージ | 入力(テキスト、画像、動画、音声) | $4.5(/M トークン/時間) | $4.5(/M トークン/時間) |
| Gemini 2.5 Pro | コンテキスト キャッシュ ストレージ | 入力(テキスト、画像、動画、音声) | $4.5(/M トークン/時間) | $4.5(/M トークン/時間) |
| Gemini 2.5 Flash | コンテキスト キャッシュ ストレージ | 入力(テキスト、画像、動画、音声) | $1(/100 万トークン/時間) | $1(/100 万トークン/時間) |
| Gemini 2.5 Flash Lite | コンテキスト キャッシュ ストレージ | 入力(テキスト、画像、動画、音声) | $1(/100 万トークン/時間) | $1(/100 万トークン/時間) |
Gemini 2.0 モデル
トークンベースの料金
モデル |
タイプ |
ストレージ (M トークン時間) |
料金 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 100 万個の入力トークン | $1.00 | $0.0375 | |
| 100 万個の入力音声トークン | $1.00 | $0.25 | |
| 100 万個の出力テキスト トークン | なし | なし | |
Gemini 2.0 Flash Lite |
|||
| 100 万個の入力トークン | $1.00 | $0.01875 | |
| 100 万個の入力音声トークン | $1.00 | $0.01875 | |
| 100 万個の出力テキスト トークン | なし | なし |
モダリティベースの料金
以下のモダリティの料金は、参考として平均的なユースケースに基づいています。実際の請求はトークンのみに基づいて行われます。
- 4 文字で、空白を含めて約 1 テキストトークンになります。
- 1024x1024 の画像の場合、1290 トークンを消費します。画像あたりのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
- 動画入力は、1 秒あたり 1 フレームのサンプルレートで、1 秒あたり 258 トークンを消費します。音声付き動画では、動画トークンと音声トークンの両方に対して課金されます。
- 音声入力は、タイムスタンプなしで 1 秒あたり 25 トークンを消費します。
モデル |
タイプ |
ストレージ (モダリティ時間) |
料金 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 入力テキスト($/100 万文字) | $0.25 | $0.009375 | |
| 入力画像($/画像) | $0.00129 | $0.000048375 | |
| 入力動画($/秒) | $0.000258 | $0.000009675 | |
| 音声入力($/秒) | $0.000025 | $0.00000625 | |
| 出力テキスト($/100 万文字) | なし | なし | |
Gemini 2.0 Flash Lite |
|||
| 入力テキスト($/100 万文字) | $0.25 | $0.0046875 | |
| 入力画像($/画像) | $0.00129 | $0.0000241875 | |
| 入力動画($/秒) | $0.000258 | $0.000009675 | |
| 音声入力($/秒) | $0.000258 | $0.0000048375 | |
| 出力テキスト($/100 万文字) | なし | なし | |
Google 検索によるグラウンディング |
Gemini 2.0 Flash には、1 日あたり最大 1,500 件のグラウンディングされたリクエストが追加料金なしで含まれています。1 日あたり 1,500 件を超えるグラウンディングされたリクエストは、1,000 件あたり 35 ドルで課金されます(1 日あたり最大 100 万件)。 1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウント チームにお問い合わせください。 |
||
エンタープライズ向けウェブ グラウンディング |
2025 年 5 月 5 日より、リクエスト 1,000 件あたり $45(1 日あたり最大 100 万件のリクエスト)。 1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウント チームにお問い合わせください。 |
||
* 料金は米ドル(USD)で表示しています。
米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* PDF は画像入力として課金され、PDF の 1 ページは 1 枚の画像に相当します。
* チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
* Google 検索によるグラウンディングは、ウェブからグラウンディング サポート URL を 1 つ以上含む結果を返すリクエストに対してのみ課金されます。標準の Gemini モデルの使用料金も適用されます。
プロビジョンド スループット
プロビジョンド スループット は、生成 AI のニーズに合わせてスループットを確保し、生成 AI スケール ユニット(GSU)を介して取引されます。各 GSU で提供されるスループットについて詳しくは、こちらをご覧ください。 オンライン見積もりツールはこちらからご利用いただけます。
| 期間 | GSU あたりの料金 | 1 日あたり |
|---|---|---|
| 1 週間のコミットメント | $1,200 | 1 週間 |
| 1 か月契約 | 2,700 ドル | 月 |
| 3 か月契約 | $2,400 | 月 |
| 1 年契約 | $2,000 | 月 |
料金計算の例
ユーザーは、gemini-2.0-flash を使用して、1,000 個のテキスト トークンと 500 個の音声トークンの入力を含むクエリの 1 秒あたり 10 件の秒間クエリ数(QPS)をサポートし、300 個のテキスト トークンの出力を受け取ることができるようにする必要があります。
スループットとバーンダウン率の表を使用すると、gemini-2.0-flash の場合、入力テキスト トークンのバーンダウン率は 1 トークン、入力音声トークンのバーンダウン率は 7 トークン、出力テキスト トークンのバーンダウン率は 4 トークンであることがわかります。
ユーザーの入力トークンの合計は、1,000 *(入力テキスト トークンあたり 1 トークン)+ 500 *(入力音声トークンあたり 7 トークン)= 4,500 個のバーンダウン調整済み入力トークンです。ユーザーの出力トークンの合計は 300 *(出力テキスト トークンあたり 4 トークン)= 1,200 個のバーンダウン調整済み出力トークンです。これらを合計すると、入力トークン(バーンダウン調整後)4,500 個 + 出力トークン(バーンダウン調整後)1,200 個 = クエリあたりの合計トークン数 5,700 個となります。
クエリあたりの合計トークン数に QPS を掛けると、クエリあたりの合計トークン数 5,700 個 × 10 QPS = 1 秒あたりの合計トークン数 57,000 個となります。
これを GSU あたりの 1 秒あたりの合計スループットで割ると、1 秒あたりの合計トークン数 57,000 ÷ GSU あたりの 1 秒あたりのスループット 3,360 = 16.96 GSU となります。このモデルの最小 GSU 購入単位は 1 であるため、ユーザーは 17 個の GSU を必要とします。
このスループットを 1 週間維持する場合、費用は 1,200 ドル * 17 GSU = 20,400 ドル / 週となります。このスループットを 1 か月維持する場合、費用は $2,700 × 17 GSU = 月額 $45,900 となります。このスループットを 3 か月間維持する場合、費用は 1 か月あたり $2,400 × 17 GSU = $40,800 となります。最後に、このスループットを 1 年間維持する場合、費用は 1 か月あたり $2,000 * 17 GSU = $34,000 となります。
モデルのチューニング
モデルのチューニングは、大規模なモデルをタスクに合わせてカスタマイズする効果的な方法です。これは、モデルの品質と効率性を改善するための重要なステップです。モデルのチューニングには次の利点があります。
- 特定のタスクの品質が向上する
- モデルの堅牢性が向上する
- プロンプトが短くなるため、推論のレイテンシとコストが低減される
チューニングは、トレーニング トークン 100 万個ごとに課金されます。トレーニング トークンの数は、トレーニング データセット内のトークンの合計数にエポック数を掛けて計算されます。モデル推論の場合、Gemini チューニング済みモデルのエンドポイントの予測料金はベースモデルと同じです。
| モデル | タイプ | 料金(100 万トレーニング トークンあたり) |
|---|---|---|
| Gemini 2.5 Pro | 教師ありファインチューニング | $25 |
| Gemini 2.5 Flash | 教師ありファインチューニング プリファレンス チューニング |
$5 |
| Gemini 2.5 Flash Lite | 教師ありファインチューニング プリファレンス チューニング |
$1.5 |
| Gemma 3 27B IT | 教師ありファインチューニング | $6.83 |
| Llama 3.1 8B | 教師ありファインチューニング | 0.67 ドル |
| Llama 3.2 1B | 教師ありファインチューニング | $0.28 |
| Llama 3.2 3B | 教師ありファインチューニング | $0.61 |
| Llama 3.3 70B | 教師ありファインチューニング | $6.72 |
| Llama 4 Scout 17B 16E | 教師ありファインチューニング | $5.77 |
| Qwen 3 32B | 教師ありファインチューニング | $6.57 |
* トレーニング トークンの数は、トレーニング データセット内のトークンの合計数にエポック数を掛けて計算されます。
* Gemini チューニング済みモデルのエンドポイントの予測料金は、ベースモデルと同じです。
Vertex AI のパートナー モデルの料金を比較する
パートナー モデルは、Google パートナーが開発した生成 AI モデルの厳選されたリストです。パートナー モデルは、マネージド API として提供されます。詳細については、パートナー モデルの概要をご覧ください。 以下のセクションでは、Google パートナー モデルの料金の詳細を記載しています。
AI21 Labs のモデル
| モデル | 料金 |
|---|---|
| Jamba 1.5 Large(非推奨) | 入力: 100 万トークンあたり $2 出力: 100 万トークンあたり $8 |
| Jamba 1.5 Mini(非推奨) | 入力: 100 万トークンあたり $0.20 出力: 100 万トークンあたり $0.40 |
Anthropic の Claude モデル
地域別の料金が設定されているモデル
グローバル
| モデル | 料金(100 万トークンあたり)< 20 万入力トークン | 料金(100 万トークンあたり)>= 20 万入力トークン |
|---|---|---|
| Claude Opus 4.5 | 入力: $5.00 出力: $25.00 バッチ入力: $2.50 バッチ出力: $12.50 5 分キャッシュ書き込み: $6.25 1 時間キャッシュ書き込み: $10.00 キャッシュ ヒット: $0.50 5 分バッチ キャッシュ書き込み: $3.125 1 時間バッチ キャッシュ書き込み: $5.00 バッチ キャッシュ ヒット: $0.25 |
|
| Claude Sonnet 4.5 | 入力: $3.00 出力: $15.00 バッチ入力: $1.50 バッチ出力: $7.50 5 分キャッシュ書き込み: $3.75 1 時間キャッシュ書き込み: $6.00 キャッシュ ヒット: $0.30 バッチ キャッシュ書き込み: $1.88 バッチ キャッシュ ヒット: $0.15 |
入力: $6.00 出力: $22.50 バッチ入力: $3.00 バッチ出力: $11.25 5 分キャッシュ書き込み: $7.50 1 時間キャッシュ書き込み: $12.00 キャッシュ ヒット: $0.60 バッチ キャッシュ書き込み: $3.75 バッチ キャッシュ ヒット: $0.30 |
| Claude Haiku 4.5 | 入力: $1.00 出力: $5.00 バッチ入力: $0.50 バッチ出力: $2.50 5 分キャッシュ書き込み: $1.25 1 時間キャッシュ書き込み: $2.00 キャッシュ ヒット: $0.10 バッチ キャッシュ書き込み: $0.625 バッチ キャッシュ ヒット: $0.05 |
us-east5
| モデル | 料金(100 万トークンあたり)< 20 万入力トークン | 料金(100 万トークンあたり)>= 20 万入力トークン |
|---|---|---|
| Claude Opus 4.5 | 入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュ ヒット: $0.55 5 分バッチ キャッシュ書き込み: $3.438 1 時間バッチ キャッシュ書き込み: $5.50 バッチ キャッシュ ヒット: $0.275 |
|
| Claude Sonnet 4.5 | 入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュ ヒット: $0.33 バッチ キャッシュ書き込み: $2.06 バッチ キャッシュ ヒット: $0.17 |
入力: $6.60 出力: $24.75 バッチ入力: $3.30 バッチ出力: $12.38 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュ ヒット: $0.66 バッチ キャッシュ書き込み: $4.13 バッチ キャッシュ ヒット: $0.33 |
| Claude Haiku 4.5 | 入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュ書き込み: $1.375 キャッシュ ヒット: $0.11 バッチ キャッシュ書き込み: $0.688 バッチ キャッシュ ヒット: $0.055 |
europe-west1
| モデル | 料金(100 万トークンあたり)< 20 万入力トークン | 料金(100 万トークンあたり)>= 20 万入力トークン |
|---|---|---|
| Claude Opus 4.5 | 入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュ ヒット: $0.55 5 分バッチ キャッシュ書き込み: $3.438 1 時間バッチ キャッシュ書き込み: $5.50 バッチ キャッシュ ヒット: $0.275 |
|
| Claude Sonnet 4.5 | 入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュ ヒット: $0.33 バッチ キャッシュ書き込み: $2.06 バッチ キャッシュ ヒット: $0.17 |
入力: $6.60 出力: $24.75 バッチ入力: $3.30 バッチ出力: $12.38 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュ ヒット: $0.66 バッチ キャッシュ書き込み: $4.13 バッチ キャッシュ ヒット: $0.33 |
| Claude Haiku 4.5 | 入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュ ヒット: $0.11 バッチ キャッシュ書き込み: $0.688 バッチ キャッシュ ヒット: $0.055 |
asia-southeast1
| モデル | 料金(100 万トークンあたり)< 20 万入力トークン | 料金(100 万トークンあたり)>= 20 万入力トークン |
|---|---|---|
| Claude Opus 4.5 | 入力: $5.50 出力: $27.50 バッチ入力: $2.75 バッチ出力: $13.75 5 分キャッシュ書き込み: $6.875 1 時間キャッシュ書き込み: $11.00 キャッシュ ヒット: $0.55 5 分バッチ キャッシュ書き込み: $3.438 1 時間バッチ キャッシュ書き込み: $5.50 バッチ キャッシュ ヒット: $0.275 |
|
| Claude Sonnet 4.5 | 入力: $3.30 出力: $16.50 バッチ入力: $1.65 バッチ出力: $8.25 5 分キャッシュ書き込み: $4.13 1 時間キャッシュ書き込み: $6.60 キャッシュ ヒット: $0.33 バッチ キャッシュ書き込み: $2.06 バッチ キャッシュ ヒット: $0.17 |
入力: $6.60 出力: $24.75 バッチ入力: $3.30 バッチ出力: $12.38 5 分キャッシュ書き込み: $8.25 1 時間キャッシュ書き込み: $13.20 キャッシュ ヒット: $0.66 バッチ キャッシュ書き込み: $4.13 バッチ キャッシュ ヒット: $0.33 |
asia-east1
| モデル | 料金(100 万トークンあたり)< 20 万入力トークン | 料金(100 万トークンあたり)>= 20 万入力トークン |
|---|---|---|
| Claude Haiku 4.5 | 入力: $1.10 出力: $5.50 バッチ入力: $0.55 バッチ出力: $2.75 5 分キャッシュ書き込み: $1.375 1 時間キャッシュ書き込み: $2.20 キャッシュ書き込み: $1.375 キャッシュ ヒット: $0.11 バッチ キャッシュ書き込み: $0.688 バッチ キャッシュ ヒット: $0.055 |
* クエリ入力コンテキストが 20 万トークン以上の場合、すべてのトークン(入力と出力)に長いコンテキストの料金が適用されます。
すべてのリージョンで料金が均一なモデル
| モデル | 料金(100 万トークンあたり)< 20 万入力トークン | 料金(100 万トークンあたり)>= 20 万入力トークン |
|---|---|---|
| Claude Opus 4.1 | 入力: $15 出力: $75 バッチ入力: $7.50 バッチ出力: $37.50 5 分間のキャッシュ書き込み: $18.75 1 時間のキャッシュ書き込み: $30 キャッシュ ヒット: $1.50 バッチ キャッシュ書き込み: $9.375 バッチ キャッシュ ヒット: $0.75 |
なし |
| Claude Opus 4 | 入力: $15 出力: $75 バッチ入力: $7.50 バッチ出力: $37.50 5 分間のキャッシュ書き込み: $18.75 1 時間のキャッシュ書き込み: $30 キャッシュ ヒット: $1.50 バッチ キャッシュ書き込み: $9.375 バッチ キャッシュ ヒット: $0.75 |
なし |
| Claude Sonnet 4 | 入力: $3 出力: $15 バッチ入力: $1.50 バッチ出力: $7.50 5 分キャッシュ書き込み: $3.75 1 時間キャッシュ書き込み: $6.00 キャッシュ ヒット: $0.30 バッチ キャッシュ書き込み: $1.875 バッチ キャッシュ ヒット: $0.15 |
入力: $6 出力: $22.50 バッチ入力: $3 バッチ出力: $11.25 5 分キャッシュ書き込み: $7.50 1 時間キャッシュ書き込み: $12.00 キャッシュ ヒット: $0.60 バッチ キャッシュ書き込み: $3.75 バッチ キャッシュ ヒット: $0.30 |
| Claude 3.5 Haiku | 入力: $0.80 出力: $4 バッチ入力: $0.40 バッチ出力: $2 5 分キャッシュ書き込み: $1 1 時間キャッシュ書き込み: $1.60 キャッシュ ヒット: $0.08 バッチ キャッシュ書き込み: $0.50 バッチ キャッシュ ヒット: $0.04 |
なし |
| Claude 3 Haiku | 入力: $0.25 出力: $1.25 5 分キャッシュ書き込み: $0.30 1 時間キャッシュ書き込み: $0.50 キャッシュ ヒット: $0.03 | なし |
| Claude 3.7 Sonnet(非推奨) | 入力: $3 出力: $15 バッチ入力: $1.50 バッチ出力: $7.50 キャッシュ書き込み: $3.75 キャッシュ ヒット: $0.30 バッチ キャッシュ書き込み: $1.875 バッチ キャッシュ ヒット: $0.15 |
なし |
| Claude 3.5 Sonnet v2(非推奨) | 入力: $3 出力: $15 バッチ入力: $1.50 バッチ出力: $7.50 キャッシュ書き込み: $3.75 キャッシュ ヒット: $0.30 バッチ キャッシュ書き込み: $1.875 バッチ キャッシュ ヒット: $0.15 |
なし |
| Claude 3.5 Sonnet(非推奨) | 入力: $3 出力: $15 キャッシュ書き込み: $3.75 キャッシュ ヒット: $0.30 |
なし |
| Claude 3 Opus(非推奨) | 入力: $15 出力: $75 キャッシュ書き込み: $18.75 キャッシュ ヒット: $1.50 |
なし |
* クエリ入力コンテキストが 20 万トークン以上の場合、すべてのトークン(入力と出力)に長いコンテキストの料金が適用されます。
ツールの料金
| ツール | 料金 |
|---|---|
| ウェブ検索リクエスト | 1,000 回の検索あたり 10 ドル
サポートされているモデル: Claude Haiku 4.5、Claude Sonnet 4.5、Claude Sonnet 4、Claude Opus 4.1、Claude Opus 4 |
* クエリ入力コンテキストが 20 万トークン以上の場合、すべてのトークン(入力と出力)に長いコンテキストの料金が適用されます。
Deepseek のモデル
| モデル | 料金 |
|---|---|
| DeepSeek-V3.1 | 入力: 100 万トークンあたり $0.60 出力: 100 万トークンあたり $1.70 バッチ入力: 100 万トークンあたり $0.30 バッチ出力: 100 万トークンあたり $0.85 |
| DeepSeek-V3.2 * | 入力: 100 万トークンあたり $0.56 出力: 100 万トークンあたり $1.68 バッチ入力: 100 万トークンあたり $0.28 バッチ出力: 100 万トークンあたり $0.84 |
| DeepSeek-R1(0528) | 入力: 100 万トークンあたり $1.35 出力: 100 万トークンあたり $5.40 バッチ入力: 100 万トークンあたり $0.675 バッチ出力: 100 万トークンあたり $2.70 |
| DeepSeek-OCR | 入力: 100 万トークンあたり $0.30(または 1 ページあたり $0.0003) 出力: 100 万トークンあたり $1.20(または 1 ページあたり $0.00012) |
- 2025 年 12 月 17 日まで無料。
MiniMax のモデル
| モデル | 料金 |
|---|---|
| MiniMax-M2 | 入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $1.20 |
Moonshot のモデル
| モデル | 料金 |
|---|---|
| Kimi-K2-Thinking | 入力: 100 万トークンあたり $0.60 出力: 100 万トークンあたり $2.50 |
Qwen のモデル
| モデル | 料金 |
|---|---|
| Qwen3-Next-80B-Thinking | 入力: 100 万トークンあたり $0.15 出力: 100 万トークンあたり $1.20 |
| Qwen3-Next-80B-Instruct | 入力: 100 万トークンあたり $0.15 出力: 100 万トークンあたり $1.20 |
| Qwen3-Coder-480B-A35B-Instruct | 入力: 100 万トークンあたり $0.22 出力: 100 万トークンあたり $1.80 バッチ入力: 100 万トークンあたり $0.11 バッチ出力: 100 万トークンあたり $0.90 |
| Qwen3-235B-A22B-Instruct-2507 | 入力: 100 万トークンあたり $0.22 出力: 100 万トークンあたり $0.88 バッチ入力: 100 万トークンあたり $0.11 バッチ出力: 100 万トークンあたり $0.44 |
OpenAI のモデル
| モデル | 料金 |
|---|---|
| gpt-oss-120b | 入力: 100 万トークンあたり $0.09 出力: 100 万トークンあたり $0.36 バッチ入力: 100 万トークンあたり $0.045 バッチ出力: 100 万トークンあたり $0.18 |
| gpt-oss-20b | 入力: 100 万トークンあたり $0.07 出力: 100 万トークンあたり $0.25 バッチ入力: 100 万トークンあたり $0.035 バッチ出力: 100 万トークンあたり $0.125 |
Meta の Llama モデル
| モデル | 料金 |
|---|---|
| Llama 3.1 405B | 入力: 100 万トークンあたり $5.00 出力: 100 万トークンあたり $16.00 |
| Llama 3.3 70B | 入力: 100 万トークンあたり $0.72 出力: 100 万トークンあたり $0.72 バッチ入力: 100 万トークンあたり $0.36 バッチ出力: 100 万トークンあたり $0.36 |
| Llama 4 Scout | 入力: 100 万トークンあたり $0.25 出力: 100 万トークンあたり $0.70 バッチ入力: 100 万トークンあたり $0.125 バッチ出力: 100 万トークンあたり $0.35 |
| Llama 4 Maverick | 入力: 100 万トークンあたり $0.35 出力: 100 万トークンあたり $1.15 バッチ入力: 100 万トークンあたり $0.175 バッチ出力: 100 万トークンあたり $0.575 |
Mistral AI のモデル
| モデル | 料金 |
|---|---|
| Mistral OCR(25.05) | 入力: 100 万トークンあたり $0.0005(または 1 ページあたり $0.0005) 出力: 100 万トークンあたり $0.0005(または 1 ページあたり $0.0005) |
| Mistral Medium 3 | 入力: 100 万トークンあたり $0.40 出力: 100 万トークンあたり $2.00 |
| Mistral Small 3.1(25.03) | 入力: 100 万トークンあたり $0.10 出力: 100 万トークンあたり $0.30 |
| Mistral Large(24.11)(非推奨) | 入力: 100 万トークンあたり $2.00 出力: 100 万トークンあたり $6.00 |
| Codestral 2 | 入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $0.90 |
| Codestral(25.01)(非推奨) | 入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $0.90 |