Vertex AI での AI モデルの構築とデプロイにかかる費用
料金は米ドル(USD)で表しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
200 レスポンス コードが返されるリクエストに対してのみ課金されます。4xx や 5xx などの他のレスポンス コードを返すリクエストは、入力または出力に対して課金されません。
このページでは、Vertex AI での生成 AI の料金について説明します。ML Platform や MLOps サービスなど、Vertex AI のその他の料金については、Vertex AI の料金ページをご覧ください。
Google モデル
Gemini 2.5
モデル | タイプ | 料金(100 万トークンあたり)<= 20 万入力トークン | 価格(100 万トークンあたり)> 20 万入力トークン | 料金(100 万トークンあたり)<= 20 万入力トークン(バッチ API を使用) | 価格(100 万トークンあたり)> バッチ API で 20 万入力トークン |
---|---|---|---|---|---|
Gemini 2.5 Pro | |||||
入力(テキスト、画像、動画、音声) | $1.25 | $2.50 | $0.625 | $1.25 | |
テキスト出力(回答と推論) | $10 | $15 | $5 | 7.5 ドル | |
Gemini 2.5 Flash GA |
|||||
入力(テキスト、画像、動画) | $0.30 | $0.30 | $0.15 | $0.15 | |
オーディオ入力 | $1 | $1 | $0.5 | $0.5 | |
テキスト出力 | $2.50 | $2.50 | $1.25 | $1.25 | |
100 万トレーニング トークン向けのチューニング | $5.00 | なし | なし | なし | |
Gemini 2.5 Flash プレビュー (エンドポイントは 2025 年 7 月 15 日に終了) |
|||||
入力(テキスト、画像、動画) | $0.15 | $0.15 | $0.075 | $0.075 | |
オーディオ入力 | $1 | $1 | $0.5 | $0.5 | |
テキスト出力(思考なし) | $0.60 | $0.60 | $0.30 | $0.30 | |
テキスト出力(思考 - 回答と推論) | $3.50 | $3.50 | $1.75 | $1.75 | |
Gemini 2.5 Flash Live API |
|||||
100 万入力テキストトークン | $0.5 | $0.5 | なし | なし | |
100 万入力音声トークン | $3 | $3 | なし | なし | |
100 万個の入力動画トークン | $3 | $3 | なし | なし | |
100 万個の出力テキスト トークン | $2 | $2 | なし | なし | |
100 万個の出力音声トークン | $12 | $12 | なし | なし | |
Gemini 2.5 Flash Lite |
|||||
入力(テキスト、画像、動画) | $0.1 | $0.1 | なし | なし | |
オーディオ入力 | $0.5 | $0.5 | なし | なし | |
テキスト出力(回答と推論) | 0.4 ドル | 0.4 ドル | なし | なし | |
Google 検索によるグラウンディング |
Gemini 2.0 Flash、2.5 Flash、2.5 Flash-Lite には、1 日あたり合計 1,500 個の根拠のあるプロンプトが追加料金なしで含まれています。Gemini 2.5 Pro では、1 日あたり 10,000 個の根拠のあるプロンプトを追加料金なしで利用できます。 Grounded プロンプトの上限を超えた場合は、Grounded プロンプト 1,000 件あたり$35 の料金が発生します。 Grounded プロンプトは、Gemini に送信され、Google 検索に 1 つ以上のクエリを送信するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。 1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。 |
||||
エンタープライズ向けウェブ グラウンディング |
1,000 個の根拠のあるプロンプトあたり$45。グラウンディング プロンプトは、Gemini に送信され、Web Grounding for Enterprise** に 1 つ以上のクエリを実行するリクエストです。複数の検索クエリが Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。 1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、アカウント チームにお問い合わせください。 |
||||
データに基づくグラウンディング | 2025 年 6 月 16 日より、リクエスト 1,000 件あたり $2.5 の料金が発生します。 |
* クエリ入力コンテキストが 20 万トークンを超える場合、すべてのトークン(入力と出力)が長いコンテキストの料金で課金されます。
** Google 検索によるグラウンディングとエンタープライズ向けウェブ グラウンディングは、プロンプトがウェブ結果(ウェブから 1 つ以上のグラウンディング サポート URL を含む結果)を正常に返した場合にのみ課金されます。Gemini モデルの使用料は別途適用されます。
Gemini 2.0
Gemini 2.0 はトークンに基づいて課金されます。リクエストを送信する前にリクエスト内の入力トークンの数を計算するには、SDK トークン化ツールまたは countTokens API を使用できます。リクエストが 400 または 500 エラーで失敗した場合、使用したトークンに対して料金は発生しません。
料金表の切り替えを使用して、トークンベースの料金とモダリティベースの料金を比較します。
トークンベースの料金
モデル | タイプ | 料金 | バッチ API の料金 |
---|---|---|---|
Gemini 2.0 Flash |
|||
100 万入力トークン | $0.15 | $0.075 | |
100 万入力音声トークン | $1.00 | $0.50 | |
100 万の出力テキスト トークン | $0.60 | $0.30 | |
100 万トレーニング トークン向けのチューニング | $3.00 | ||
Gemini 2.0 Flash 画像生成 |
|||
100 万入力トークン | $0.15 | ||
100 万入力音声トークン | $1.00 | ||
100 万個の入力動画トークン | $3 | ||
100 万個の出力テキスト トークン | $0.60 | ||
100 万個の出力画像トークン | $30.00 | ||
Gemini 2.0 Flash Live API |
|||
100 万入力テキストトークン | $0.5 | ||
100 万入力音声トークン | $3 | ||
100 万個の入力動画トークン | $3 | ||
100 万個の出力テキスト トークン | $2 | ||
100 万個の出力音声トークン | $12 | ||
Gemini 2.0 Flash Lite |
|||
100 万入力トークン | $0.075 | $0.0375 | |
100 万入力音声トークン | $0.075 | $0.0375 | |
100 万の出力テキスト トークン | $0.30 | $0.15 | |
100 万トレーニング トークン向けのチューニング | $1.00 | ||
Google 検索によるグラウンディング |
Gemini 2.0 Flash と 2.5 Flash には、1 日あたり合計 1,500 個の根拠のあるプロンプトが追加料金なしで含まれています。 上記の制限を超える Grounded プロンプトは、1,000 個あたり$35 の料金が発生します。 グラウンディング プロンプトは、Gemini に送信され、Google 検索* に 1 つ以上のクエリを実行するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。 1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。 |
||
エンタープライズ向けウェブ グラウンディング |
1,000 個の根拠のあるプロンプトあたり$45。グラウンディング プロンプトは、Gemini に送信されるリクエストで、Web Grounding for Enterprise* に 1 つ以上のクエリを送信します。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。 1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。 |
||
データに基づくグラウンディング | 2025 年 6 月 16 日より、リクエスト 1,000 件あたり $2.5 の料金が発生します。 |
モダリティベースの料金
以下のモダリティの料金は、平均的なユースケースに基づいており、参考情報としてのみ提供されています。実際の課金はトークンに基づいてのみ行われます。
- 4 文字は、空白文字を含めて約 1 つのテキスト トークンになります。
- 1024×1024 ピクセルの画像の場合、1, 290 個のトークンが消費されます。画像ごとのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
- 動画入力は、1 秒あたり 1 フレームのサンプリング レートで、1 秒あたり 258 個のトークンを消費します。動画と音声の組み合わせでは、動画トークンと音声トークンの両方に対して課金されます。
- 音声入力は、タイムスタンプなしで 1 秒あたり 25 個のトークンを消費します。
モデル | タイプ | 料金 | バッチ API の料金 |
---|---|---|---|
Gemini 2.0 Flash |
|||
テキストを入力(1 文字あたりの単価/100 万文字) | $0.0375 | $0.01875 | |
入力画像($/画像) | $0.0001935 | $0.00009675 | |
入力動画($/秒) | $0.0000387 | $0.00001935 | |
入力音声($/秒) | $0.000025 | $0.0000125 | |
出力テキスト(100 万文字あたりの料金) | $0.15 | $0.075 | |
Gemini 2.0 Flash 画像生成 |
|||
テキストを入力(1 文字あたりの単価/100 万文字) | $0.0375 | ||
入力画像($/画像) | $0.0001935 | ||
入力動画($/秒) | $0.0000387 | ||
入力音声($/秒) | $0.000025 | ||
出力テキスト(100 万文字あたりの料金) | $0.15 | ||
出力画像(画像)(1 画像あたりの料金) | $0.04 | ||
Gemini 2.0 Flash Lite |
|||
テキストを入力(1 文字あたりの単価/100 万文字) | $0.01875 | $0.009375 | |
入力画像($/画像) | $0.00009675 | $0.000048375 | |
入力動画($/秒) | $0.00001935 | $0.000009675 | |
入力音声($/秒) | $0.000001875 | $0.000000938 | |
出力テキスト(100 万文字あたりの料金) | $0.075 | $0.0375 | |
Google 検索によるグラウンディング |
Gemini 2.0 Flash と 2.5 Flash には、1 日あたり合計 1,500 個の根拠のあるプロンプトが追加料金なしで含まれています。 上記の制限を超える Grounded プロンプトは、1,000 個あたり$35 の料金が発生します。 グラウンディング プロンプトは、Gemini に送信され、Google 検索* に 1 つ以上のクエリを実行するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。 1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。 |
||
エンタープライズ向けウェブ グラウンディング |
1,000 個の根拠のあるプロンプトあたり$45。グラウンディング プロンプトは、Gemini に送信されるリクエストで、Web Grounding for Enterprise* に 1 つ以上のクエリを送信します。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。 1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様を担当するアカウント チームにお問い合わせください。 |
* 料金は米ドル(USD)で表示しています。
米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* トレーニング トークンの数は、トレーニング データセット内のトークンの合計数にエポック数を掛けて計算されます。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像に相当します。
* チューニング済みモデルのエンドポイントは、ベースモデルと同じ予測料金です。
* Google 検索によるグラウンディングとエンタープライズ向けウェブ グラウンディングは、プロンプトがウェブ結果(ウェブから 1 つ以上のグラウンディング サポート URL を含む結果)を正常に返した場合にのみ課金されます。Gemini モデルの使用料は別途適用されます。
* Gemini 2.0 Flash Live API: 音声(入力/出力)は 1 秒あたり 25 個のトークン、動画(入力)は 1 秒あたり 258 個のトークン。Gemini 2.0 Flash Live API がプレビュー版である間は、Google 検索によるグラウンディングは引き続き無料でご利用いただけます。
Vertex AI Model Optimizer の料金(試験運用版)*
Vertex AI Model Optimizer は、Gemini モデルのリクエストに単一のメタエンドポイントを提供することで、エンタープライズ カスタマーによる Gemini の使用を簡素化します。このサービスを利用するカスタマーは、Flash、Pro、または特定のバージョンを使用するかどうかを指定する必要はありません。代わりに、構成可能な設定(費用、品質、バランス)を指定することで、好みを示すことができます。Model Optimizer は、各クエリを最適なモデルに送信することで、タスクに適した適切なレベルのインテリジェンスを適用します。
Vertex AI Model Optimizer は動的な料金設定を適用します。つまり、トークンあたりの平均料金は、タスクを完了するために適用されるモデルのインテリジェンス レベルによって異なります。そのため、構成設定に基づく可能性のあるシナリオを説明するために、以下の料金例を用意しました(下の表を参照)。Model Optimizer SKU は $1 の SKU で、請求に適用される購入単位として機能します。モデルを使用した後も、従量課金制で請求されます。
I/O 比率 5:1 | 例 1 chat bot |
注: これらの範囲は保証されるわけではなく、お客様ごとに結果が異なる場合があります | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
お客様の好み | お客様の入力トークンが MO に送信される | お客様の出力トークンが MO に送信される | 100 万トークンあたりの平均入力価格(上限) | 100 万トークンあたりの平均出力価格(上限) | 100 万トークンあたりの平均入力価格(下限) | 100 万トークンあたりの平均出力価格(下限) | |||||
費用 | 10,000,000 | 2,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
バランス | 10,000,000 | 2,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
品質 | 10,000,000 | 2,000,000 | 1.89 ドル | $7.50 | $1.26 | $5.00 |
I/O 比 1:20 | 例 2 コンテンツ生成 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
お客様の好み | お客様の入力トークンが MO に送信される | お客様の出力トークンが MO に送信される | 100 万トークンあたりの平均入力価格(上限) | 100 万トークンあたりの平均出力価格(上限) | 100 万トークンあたりの平均入力価格(下限) | 100 万トークンあたりの平均出力価格(下限) | |||||
費用 | 1,000,000 | 20,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
バランス | 1,000,000 | 20,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
品質 | 1,000,000 | 20,000,000 | 1.89 ドル | $7.50 | $1.26 | $5.00 |
その他の Gemini モデル
Gemini 2.0 以外のすべての Gemini モデルは、文字数、画像、動画/音声秒数などのモダリティに基づいて課金されます。テキスト入力は、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。その結果、トークンあたり約 4 文字になります。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後に、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。メディア入力は、画像ごと、または秒ごと(動画)に課金されます。リクエストが失敗して 400 または 500 エラーが発生した場合、使用したトークンに対して料金は発生しません。
モデル | 機能 | タイプ | 料金 (= 128K 入力トークン以下) |
価格 (128K 以上の入力トークン) |
||
---|---|---|---|---|---|---|
Gemini 1.5 Flash | マルチモーダル | 画像入力 動画入力 テキスト入力 音声入力 |
$0.00002 / 画像 $0.00002 / 秒 $0.00001875 / 1,000 文字 $0.000002 / 秒 |
$0.00004 / 画像 $0.00004 / 秒 $0.0000375 / 1,000 文字 $0.000004 / 秒 |
||
テキスト出力 | $0.000075 / 1,000 文字 | $0.00015 / 1,000 文字 | ||||
チューニング* | トレーニング トークン | $8 / 100 万トークン | ||||
Gemini 1.5 Pro | マルチモーダル | 画像入力 動画入力 テキスト入力 音声入力 |
$0.00032875 / 画像 $0.00032875 / 秒 $0.0003125 / 1,000 文字 $0.00003125 / 秒 |
$0.0006575 / 画像 $0.0006575 / 秒 $0.000625 / 1,000 文字 $0.0000625 / 秒 |
||
テキスト出力 | $0.00125 / 1,000 文字 | $0.0025 / 1,000 文字 | ||||
チューニング* | トレーニング トークン | $80 / 100 万トークン | ||||
Gemini 1.0 Pro | マルチモーダル | 画像入力 動画入力 テキスト入力 |
$0.0025 / 画像 $0.002 / 秒 $0.000125 / 1,000 文字 |
|||
テキスト出力 | $0.000375 / 1k 文字 | |||||
Google 検索によるグラウンディング | テキスト | 1,000 個の根拠のあるプロンプトあたり$35。 グラウンディング プロンプトは、Gemini に送信され、Google 検索* に 1 つ以上のクエリを実行するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。 1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様のアカウント担当者にお問い合わせください。 |
||||
エンタープライズ向けウェブ グラウンディング | テキスト | 1,000 個の根拠のあるプロンプトあたり$45。 グラウンディング プロンプトは、Gemini に送信され、Web Grounding for Enterprise* に 1 つ以上のクエリを実行するリクエストです。複数の検索語句が Google 検索に送信されても、根拠のあるプロンプトに対しては 1 回しか課金されません。 1 日あたり 100 万件を超える根拠のあるプロンプトが必要になる場合は、お客様のアカウント担当者にお問い合わせください。 |
||||
データに基づくグラウンディング | テキスト | 2025 年 6 月 16 日より、リクエスト 1,000 件あたり $2.5 の料金が発生します。 |
* 料金は米ドル(USD)で表示しています。
米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* クエリ コンテキストが 128K より長い場合、すべてのトークンが長いコンテキスト料金で課金されます。
* Gemini モデルは、バッチモードで 50% 割引で利用できます。
* Gemini 1.0 Pro は最大 32K のコンテキスト ウィンドウのみをサポートします。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像に相当します。
* チューニング済みモデルのエンドポイントは、ベースモデルと同じ予測料金です。
* Google 検索によるグラウンディングとエンタープライズ向けウェブ グラウンディングは、プロンプトがウェブ結果(ウェブから 1 つ以上のグラウンディング サポート URL を含む結果)を正常に返した場合にのみ課金されます。Gemini モデルの使用料は別途発生します。
Imagen
Vertex AI の Imagen を使用すると、テキスト プロンプトを送信することで、新しい画像の生成や画像の編集をしたり、またマスク領域を定義して画像の一部を編集したりできます。この他にも多くの機能を利用できます。
モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
---|---|---|---|---|---|
Imagen 4 Ultra | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.06 |
画像 4 | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.04 |
Imagen 4 Fast | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.02 |
Imagen 3 | 画像生成 | 画像を生成 画像を編集 画像をカスタマイズ |
テキスト プロンプト | 画像 | 画像 1 枚あたり $0.04 |
Imagen 3 Fast | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.02 |
Imagen 2、Imagen | 画像生成 | 画像を生成する | テキスト プロンプト | 画像 | 画像 1 枚あたり $0.020 |
画像編集 | マスクなしまたはマスクを使用して画像を編集する | 画像 / テキスト プロンプト | 画像 | 画像 1 枚あたり $0.020 | |
アップスケーリング | 生成された画像の解像度を 2K と 4K に上げる | 画像 | 画像 | 画像 1 枚あたり $0.003 | |
ファインチューニング | ユーザーが提供した「テーマ」を Imagen のプロンプトとして使用できるようにする(few shot training) | テキスト識別子と 4-8 枚の画像を含めたテーマ | ファイン チューニングされたモデル(ユーザーが提供したテーマでのトレーニング後) | 1 ノード時間あたりの $(Vertex AI カスタム トレーニング料金) | |
画像キャプション | 画像に短い / 長いテキスト キャプションを生成 | 画像 | テキスト キャプション | $0.0015 / 画像 | |
Visual Q&A | 画像に関連した質問に対し回答を提供 | 画像 / テキスト プロンプト | テキスト回答 | $0.0015 / 画像 |
料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
Veo
Veo 2 は、現実世界の物理法則や人間の動作や表情のニュアンスに対する理解を深め、幅広いテーマやスタイルで非常に高品質な動画を作成します。
モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
---|---|---|---|---|---|
Veo 3 | 動画生成 | テキスト プロンプトまたは参照画像から動画を生成 | テキスト/画像 プロンプト | 動画 | $0.50/秒 |
Veo 3 | 動画 + 音声生成 | テキスト プロンプトまたは参照画像から、同期した音声/効果音付きの動画を生成する | テキスト/画像 プロンプト | 動画 + 音声 | $0.75/秒 |
Veo 2 | 動画生成 | テキスト プロンプトまたは参照画像から動画を生成 | テキスト/画像 プロンプト | 動画 | $0.50/秒 |
Veo 2 | 高度な管理機能 | 開始フレームと終了フレームの補間によって動画を生成、生成した動画を拡張、カメラコントロールを適用 | テキスト/画像/動画 プロンプト | 動画 | $0.50/秒 |
Lyria
Lyria 2 は、ニュアンスのある出力が鍵となる、洗練された作曲や詳細なクリエイティブな探求に最適な高品質の楽器音楽生成を提供します。
モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
---|---|---|---|---|---|
Lyria 2 | 音楽生成 | テキスト プロンプトから音楽を生成する | テキスト プロンプト | 音楽 | 30 秒あたり $0.06 |
AI アプリケーションのエンベディング費用を把握する
モデル | 型 | リージョン | 1,000 個の入力トークンあたりの料金 |
---|---|---|---|
Gemini の埋め込み | 入力 | グローバル |
|
出力 | グローバル |
|
モデル | 型 | リージョン | 1,000 文字あたりの料金 |
---|---|---|---|
テキストのエンベディング (Gemini エンベディングを除く) |
入力 | グローバル |
|
出力 | グローバル |
|
モデル | 機能 | 説明 | 入力 | 出力 | 料金 |
---|---|---|---|---|---|
multimodal エンベディング | マルチモーダルのエンベディング: テキスト | テキストを入力としてエンベディングを生成 | テキスト | エンベディング | $0.0002 / 入力 1,000 文字 |
マルチモーダルのエンベディング: 画像 | 画像を入力としてエンベディングを生成 | 画像 | エンベディング | $0.0001 / 画像入力 | |
マルチモーダルのエンベディング: 動画プラス | Video Plus | 動画 | エンベディング(動画 1 分あたり最大 15 個のエンベディング) | 動画の 1 秒あたり $0.0020 | |
マルチモーダルのエンベディング: 動画標準 | 動画 標準 | 動画 | エンベディング(動画 1 分あたり最大 8 エンベディング) | 動画 1 秒あたり $0.0010 | |
マルチモーダルのエンベディング: 動画の基本 | 動画の基本 | 動画 | エンベディング(動画 1 分あたり最大 4 エンベディング) | 動画 1 秒あたり $0.0005 |
料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
Vertex AI のコード補完の料金
Vertex AI における生成 AI の利用では、入力(プロンプト)1,000 文字ごと、出力(レスポンス)1,000 文字ごとに課金されます。文字数は UTF-8 コードポイントでカウントされ、空白文字はカウントから除外されます。プレビュー段階では、料金が 100% 割引されます。予測リクエストで応答がフィルタリングされた場合、課金対象は入力のみとなります。各請求期間の最後に、1 セント($0.01)未満の小数部分は、1 セントに切り上げられます。
モデル | 型 | リージョン | 1,000 文字あたりの料金 |
---|---|---|---|
コード補完用 Codey | 入力 | グローバル |
|
出力 | グローバル |
|
料金は米ドル(USD)で表示しています。 米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
翻訳(テキスト)
Vertex AI API と翻訳 LLM を使用してテキストを翻訳します。LLM 翻訳は、従来の翻訳モデルよりも流暢で人間らしい表現になりやすい傾向がありますが、サポートされている言語は限られています(詳細はこちら)。
モデル | メソッド | 用途 | 100 万文字あたりの料金 |
---|---|---|---|
LLM | テキスト翻訳* | 1 か月あたりの入力文字数 |
$10/100 万文字* |
1 か月あたりの出力文字数 |
$10/1,000,000 文字* |
料金は米ドル(USD)で表示しています。
米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
*料金はモデルで処理された文字数に基づきます。文字のカウントについての詳細は、課金対象の文字をご覧ください。
Vertex AI のコンテキスト キャッシュを使用して費用を最適化する
コンテキスト キャッシュ保存を使用すると、入力テキストまたはメディアのコンテキスト部分を Gemini モデルにキャッシュ保存することで、Gemini 入力トークン処理の費用を 75% 削減し、コンテンツ生成のレイテンシを短縮できます。データがキャッシュに保存される期間(ユーザーが制御可能)によって、「Context Cache Storage」の料金が決まります。キャッシュされたコンテキストを作成する場合、標準の入力トークン料金が請求されます。入力データのキャッシュ ヒットには、通常の入力料金ではなく、割引料金の「キャッシュ入力」が適用されます。ストレージと入力の両方のデータサイズは、Gemini の入力料金と同じ方法で計算されます。
Gemini 2.5 モデル
モデル | 機能 | タイプ | 料金(100 万トークンあたり) <= 20 万入力トークン |
料金(100 万トークンあたり) > 20 万入力トークン |
---|---|---|---|---|
Gemini 2.5 Pro | キャッシュ入力 | 入力(テキスト、画像、動画、音声) | $0.31(100 万トークンあたり) | $0.625(100 万トークンあたり) |
出力 | なし | なし | ||
コンテキスト キャッシュのストレージ | 入力(テキスト、画像、動画、音声) | $4.5(/M Tok/時間) | $4.5(/M Tok/時間) | |
Gemini 2.5 Flash | キャッシュ入力 | 入力(テキスト、画像、動画、音声) | $0.0375(/1M トークン) | $0.0375(/1M トークン) |
出力 | なし | なし | ||
コンテキスト キャッシュのストレージ | 入力(テキスト、画像、動画、音声) | $1(/M Tok/時間) | $1(/M Tok/時間) |
Gemini 2.0 モデル
トークンベースの料金
モデル |
タイプ |
ストレージ (M 時間) |
料金 |
---|---|---|---|
Gemini 2.0 Flash |
|||
100 万入力トークン | $1.00 | $0.0375 | |
100 万入力音声トークン | $1.00 | $0.25 | |
100 万の出力テキスト トークン | なし | なし | |
Gemini 2.0 Flash Lite |
|||
100 万入力トークン | $1.00 | $0.01875 | |
100 万入力音声トークン | $1.00 | $0.01875 | |
100 万の出力テキスト トークン | なし | なし |
モダリティベースの料金
以下のモダリティの料金は、平均的なユースケースに基づいており、参考情報としてのみ提供されています。実際の課金はトークンに基づいてのみ行われます。
- 4 文字は、空白文字を含めて約 1 つのテキスト トークンになります。
- 1024×1024 ピクセルの画像の場合、1, 290 個のトークンが消費されます。画像ごとのトークン数は、画像の解像度によって異なります。トークンの計算方法について詳しくは、ドキュメントをご覧ください。
- 動画入力は、1 秒あたり 1 フレームのサンプリング レートで、1 秒あたり 258 個のトークンを消費します。動画と音声の組み合わせでは、動画トークンと音声トークンの両方に対して課金されます。
- 音声入力は、タイムスタンプなしで 1 秒あたり 25 個のトークンを消費します。
モデル |
タイプ |
ストレージ (モダリティ時間) |
料金 |
---|---|---|---|
Gemini 2.0 Flash |
|||
テキストを入力(1 文字あたりの単価/100 万文字) | $0.25 | $0.009375 | |
入力画像($/画像) | $0.00129 ~ | $0.000048375 | |
入力動画($/秒) | $0.000258 | $0.000009675 | |
入力音声($/秒) | $0.000025 | $0.00000625 | |
出力テキスト(100 万文字あたりの料金) | なし | なし | |
Gemini 2.0 Flash Lite |
|||
テキストを入力(1 文字あたりの単価/100 万文字) | $0.25 | $0.0046875 | |
入力画像($/画像) | $0.00129 ~ | $0.0000241875 | |
入力動画($/秒) | $0.000258 | $0.000009675 | |
入力音声($/秒) | $0.000258 | $0.0000048375 | |
出力テキスト(100 万文字あたりの料金) | なし | なし | |
Google 検索によるグラウンディング |
Gemini 2.0 Flash では、1 日あたり最大 1,500 件の地上リクエストを追加料金なしで利用できます。1 日あたり 1,500 件を超える Grounded リクエスト は、リクエスト 1,000 件あたり 35 ドルで課金されます(1 日あたり最大 100 万件のリクエスト)。 1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウント担当者にお問い合わせください。 |
||
エンタープライズ向けウェブ グラウンディング |
2025 年 5 月 5 日より、リクエスト 1,000 件あたり $45(1 日あたり最大 100 万件のリクエスト) 1 日あたり 100 万件を超えるリクエストが必要な場合は、アカウント担当者にお問い合わせください。 |
* 料金は米ドル(USD)で表示しています。
米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。
* PDF は画像入力として課金され、1 つの PDF ページが 1 つの画像に相当します。
* チューニング済みモデルのエンドポイントは、ベースモデルと同じ予測料金です。
* Google 検索によるグラウンディングは、ウェブから 1 つ以上のグラウンディング サポート URL を含む結果が返されたリクエストに対してのみ課金されます。通常の Gemini モデル使用料も適用されます。
プロビジョニングされたスループット
プロビジョンド スループットは、生成 AI のニーズに応じたスループットを保証し、生成 AI スケール ユニット(GSU)を介してトランザクションが行われます。各 GSU が提供するスループットについて詳しくはこちら を、オンライン見積もりツールについてはこちらをご覧ください。
期間 | GSU あたりの料金 | 1 回あたり |
---|---|---|
1 週間契約 | 1,200 ドル | 1 週間 |
1 か月契約 | 2,700 ドル | 月 |
3 か月契約 | $2,400 | 月 |
1 年契約 | $2,000 | 月 |
料金計算の例
ユーザーは、1,000 個のテキスト トークンと 500 個のオーディオ トークンの入力で 1 秒あたり 10 件のクエリ(QPS)をサポートし、gemini-2.0-flash を使用して 300 個のテキスト トークンの出力を受け取る必要があります。
スループットとバーンダウン率の表から、gemini-2.0-flash では、入力テキスト トークンのバーンダウン率は 1 トークン、入力音声トークンのバーンダウン率は 7 トークン、出力テキスト トークンのバーンダウン率は 4 トークンであることがわかります。
ユーザーの入力トークンの合計は、1,000*(入力テキスト トークンあたり 1 トークン)+ 500*(入力音声トークンあたり 7 トークン)= 4,500 のバーンドゥ 調整入力トークンです。ユーザーの出力トークンの合計は、300 ×(出力テキストトークンあたり 4 トークン)= 1,200 バーンダウン調整済み出力トークンです。合計すると、4,500 個のバーンダウン調整済み入力トークン + 1,200 個のバーンダウン調整済み出力トークン = クエリあたり合計 5,700 個のトークンとなります。
クエリあたりの合計トークン数に QPS を掛けると、クエリあたりの合計トークン数 5,700 個 × QPS 10 = 1 秒あたりの合計トークン数 57,000 個となります。
これを GSU あたりの 1 秒あたりの合計スループットで割ると、1 秒あたりの合計トークン数 57,000 ÷ GSU あたりの 1 秒あたりのスループット 3,360 = 16.96 GSU となります。このモデルの最小 GSU 購入単位は 1 なので、ユーザーは 17 個の GSU が必要になります。
このスループットを 1 週間維持する場合、1,200 ドル × 17 GSU = 1 週間あたり 20,400 ドルの費用がかかります。このスループットを 1 か月間維持する場合、$2,700 × 17 GSU = 1 か月あたり $45,900 の費用がかかります。このスループットを 3 か月間維持する場合、費用は $2,400 × 17 GSU = 月額 $40,800 になります。最後に、このスループットを 1 年間維持する場合、1 か月あたり $2,000 × 17 GSU = $34,000 の費用がかかります。
Vertex AI のパートナー モデルの料金の比較
パートナー モデルは、Google パートナーが開発した生成 AI モデルの厳選されたリストです。パートナー モデルは、マネージド API として提供されます。詳細については、パートナー モデルの概要をご覧ください。以下のセクションでは、Google パートナー モデルの料金の詳細を記載しています。
AI21 Labs のモデル
モデル | 料金 |
---|---|
Jamba 1.5 Large | 入力: 100 万トークンあたり $2 出力: 100 万トークンあたり $8 |
Jamba 1.5 Mini | 入力: 100 万トークンあたり $0.20 出力: 100 万トークンあたり $0.40 |
Anthropic の Claude モデル
モデル | 料金 |
---|---|
Claude Opus 4 | 入力: 100 万トークンあたり $15 出力: 100 万トークンあたり $75 バッチ入力: 100 万トークンあたり $7.50 バッチ出力: 100 万トークンあたり $37.50 キャッシュ書き込み: 100 万トークンあたり $18.75 キャッシュヒット: 100 万トークンあたり $1.50 バッチキャッシュ書き込み: 100 万トークンあたり $9.375 バッチキャッシュヒット: 100 万トークンあたり $0.75 |
Claude Sonnet 4 | 入力: 100 万トークンあたり $3 出力: 100 万トークンあたり $15 バッチ入力: 100 万トークンあたり $1.50 バッチ出力: 100 万トークンあたり $7.50 キャッシュ書き込み: 100 万トークンあたり $3.75 キャッシュヒット: 100 万トークンあたり $0.30 バッチキャッシュ書き込み: 100 万トークンあたり $1.875 バッチキャッシュヒット: 100 万トークンあたり $0.15 |
Claude 3.7 Sonnet | 入力: 100 万トークンあたり $3 出力: 100 万トークンあたり $15 バッチ入力: 100 万トークンあたり $1.50 バッチ出力: 100 万トークンあたり $7.50 キャッシュ書き込み: 100 万トークンあたり $3.75 キャッシュヒット: 100 万トークンあたり $0.30 バッチキャッシュ書き込み: 100 万トークンあたり $1.875 バッチキャッシュヒット: 100 万トークンあたり $0.15 |
Claude 3.5 Haiku | 入力: 100 万トークンあたり $0.80 出力: 100 万トークンあたり $4 バッチ入力: 100 万トークンあたり $0.40 バッチ出力: 100 万トークンあたり $2 キャッシュ書き込み: 100 万トークンあたり $1 キャッシュヒット: 100 万トークンあたり $0.08 バッチキャッシュ書き込み: 100 万トークンあたり $0.50 バッチキャッシュヒット: 100 万トークンあたり $0.04 |
Claude 3.5 Sonnet v2 | 入力: 100 万トークンあたり $3 出力: 100 万トークンあたり $15 バッチ入力: 100 万トークンあたり $1.50 バッチ出力: 100 万トークンあたり $7.50 キャッシュ書き込み: 100 万トークンあたり $3.75 キャッシュヒット: 100 万トークンあたり $0.30 バッチキャッシュ書き込み: 100 万トークンあたり $1.875 バッチキャッシュヒット: 100 万トークンあたり $0.15 |
Claude 3.5 Sonnet | 入力: 100 万トークンあたり $3 出力: 100 万トークンあたり $15 キャッシュ書き込み: 100 万トークンあたり $3.75 キャッシュヒット: 100 万トークンあたり $0.30 |
Claude 3 Haiku | 入力: 100 万トークンあたり $0.25 出力: 100 万トークンあたり $1.25 キャッシュ書き込み: 100 万トークンあたり $0.30 キャッシュヒット: 100 万トークンあたり $0.03 |
Claude 3 Sonnet (deprecated) | 入力: 100 万トークンあたり $3 出力: 100 万トークンあたり $15 |
Claude 3 Opus | 入力: 100 万トークンあたり $15 出力: 100 万トークンあたり $75 キャッシュ書き込み: 100 万トークンあたり $18.75 キャッシュヒット: 100 万トークンあたり $1.50 |
Meta の Llama モデル
モデル | 料金 |
---|---|
Llama 3.1 405B | 入力: 100 万トークンあたり $5.00 出力: 100 万トークンあたり $16.00 |
Llama 3.3 70B * | 入力: 100 万トークンあたり $0.72 出力: 100 万トークンあたり $0.72 |
Llama 4 Scout * | 入力: 100 万トークンあたり $0.25 出力: 100 万トークンあたり $0.70 |
Llama 4 Maverick * | 入力: 100 万トークンあたり $0.35 出力: 100 万トークンあたり $1.15 |
- 2025 年 5 月 1 日まで無料視聴可能。
Mistral AI のモデル
モデル | 料金 |
---|---|
Mistral OCR(25.05) | 入力: 100 万トークンあたり $0.0005(または 1 ページあたり $0.0005) 出力: 100 万トークンあたり $0.0005(または 1 ページあたり $0.0005) |
Mistral Small 3.1(25.03) | 入力: 100 万トークンあたり $0.10 出力: 100 万トークンあたり $0.30 |
Mistral Large(24.11) | 入力: 100 万トークンあたり $2.00 出力: 100 万トークンあたり $6.00 |
Mistral Nemo | 入力: 100 万トークンあたり $0.15 出力: 100 万トークンあたり $0.15 |
Codestral(25.01) | 入力: 100 万トークンあたり $0.30 出力: 100 万トークンあたり $0.90 |