在 Vertex AI 中建構及部署 AI 模型的費用

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，則會按照 Cloud Platform SKU 頁面列出的相應貨幣價格計費。

只有傳回 200 回應代碼的要求會產生費用。如果要求傳回其他回應代碼 (例如 4xx 和 5xx 代碼)，則輸入或輸出內容不會產生費用。

本頁說明 Vertex AI 的生成式 AI 定價。如要瞭解其他 Vertex AI 服務 (包括 ML 平台和 MLOps 服務) 的定價，請參閱 Vertex AI 定價頁面。

Google 模型

Gemini 3

標準

型號	類型	價格 (每 100 萬個詞元) <= 20 萬個輸入詞元	價格 (每 100 萬個權杖) > 20 萬個輸入權杖	價格 (每 100 萬個詞元) <= 20 萬個快取輸入詞元	價格 (每 100 萬個符記) > 20 萬個快取輸入符記
Gemini 3 Pro 預先發布版
	輸入內容 (文字、圖片、影片、音訊)	$2 美元	$4 美元	$0.2	$0.4
	文字輸出內容 (回覆和推理)	$12 美元	$18 美元	不適用	不適用
	圖片輸出內容**	$120	不適用	不適用	不適用
Gemini 3 Flash 預先發布版
	輸入內容 (文字、圖片、影片)	$0.5	$0.5	$0.05 美元	$0.05 美元
	輸入 (音訊)	$1 美元	$1 美元	$0.1 美元	$0.1 美元
	文字輸出內容 (回覆和推理)	$3 美元	$3 美元	不適用	不適用

優先順序

型號	類型	價格 (每 100 萬個詞元) <= 20 萬個輸入詞元 (優先)	價格 (每 100 萬個權杖) > 20 萬個輸入權杖 (優先)	價格 (每 100 萬個詞元) <= 20 萬個 cached 輸入詞元 (優先順序)	價格 (每 100 萬個詞元) > 20 萬個快取輸入詞元 (優先順序)
Gemini 3 Pro 預先發布版
	輸入內容 (文字、圖片、影片、音訊)	$3.6	$7.2	$0.36 美元	$0.72 美元
	文字輸出內容 (回覆和推理)	$21.6	$32.4	$2.16 美元	$3.24 美元
	圖片輸出內容**	不適用	不適用	不適用	不適用
Gemini 3 Flash 預先發布版
	輸入內容 (文字、圖片、影片)	$0.9	$0.9	$0.09 美元	$0.09 美元
	輸入 (音訊)	$1.8	$1.8	$0.18 美元	$0.18 美元
	文字輸出內容 (回覆和推理)	$5.4	$5.4	$0.54 美元	$0.54 美元

彈性/批次

型號	類型	價格 (每 100 萬個詞元) <= 20 萬個輸入詞元 (搭配彈性/批次模式)	價格 (每 100 萬個詞元) > 20 萬個輸入詞元 (彈性/批次)
Gemini 3 Pro 預先發布版
	輸入內容 (文字、圖片、影片、音訊)	$1 美元	$2 美元
	文字輸出內容 (回覆和推理)	$6 美元	$9 美元
	圖片輸出內容**	$60	不適用
Gemini 3 Flash 預先發布版
	輸入內容 (文字、圖片、影片)	$0.25 美元	$0.25 美元
	輸入 (音訊)	$0.5	$0.5
	文字輸出內容 (回覆和推理)	$1.5	$1.5

功能	定價
以 Google 搜尋建立基準，以及企業適用的網路內容建立基準	每月可免費使用 5,000 次搜尋查詢，適用於所有 Gemini 3 模型。超過這些上限的搜尋查詢，將以每 1,000 次搜尋查詢 $14 美元的費率計費。客戶向 Gemini 提交要求後，系統可能會向 Google 搜尋 (或 Web Grounding for Enterprise) 發出一個或多個查詢。系統會針對您執行的每項個別搜尋查詢收取費用。系統將於 2026 年 1 月 5 日開始計費。使用 Google 搜尋或 Web Grounding for Enterprise 建立基準時，輸入的權杖不需付費。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。
利用 Google 地圖建立基準	每月可免費使用 5,000 次搜尋查詢，適用於所有 Gemini 3 模型。超出這些限制的 Maps 查詢，每 1,000 次查詢會收取 $14 美元。客戶向 Gemini 提交要求後，可能會產生一或多個 Google 地圖查詢。系統會針對您執行的每項查詢個別收費。2026 年 1 月 5 日開始計費 Google 地圖提供的輸入權杖不需付費。
以您的資料建立基準	每 1,000 個提示 $2.50 美元。

* 如果查詢輸入內容超過 20 萬個詞元，所有詞元 (輸入和輸出) 都會以長脈絡費率計費。
** 1K (1024x1024) 和 2K (2048x2048) 輸出圖片會消耗 1, 120 個圖片輸出權杖，相當於每張圖片 $0.134 美元。4K (4096x4096) 圖片會消耗 2, 000 個圖片輸出權杖，相當於每張生成圖片 $0.24 美元。

Gemini 2.5

標準

型號	類型	價格 (每 100 萬個詞元) <= 20 萬個輸入詞元	價格 (每 100 萬個權杖) > 20 萬個輸入權杖	價格 (每 100 萬個詞元) <= 20 萬個快取輸入詞元	價格 (每 100 萬個符記) > 20 萬個快取輸入符記
Gemini 2.5 Pro
	輸入內容 (文字、圖片、影片、音訊)	$1.25 美元	$2.5	$0.125 美元	$0.250 美元
	文字輸出內容 (回覆和推理)	$10 美元	$15	不適用	不適用
Gemini 2.5 Pro 電腦使用 - 預先發布版
	輸入內容 (文字、圖片、影片、音訊)	$1.25 美元	$2.5	不適用	不適用
	文字輸出內容 (回覆和推理)	$10.00	$15.00	不適用	不適用
Gemini 2.5 Flash
	輸入內容 (文字、圖片、影片)	$0.30 美元	$0.30 美元	$0.030 美元	$0.030 美元
	音訊輸入	$1 美元	$1 美元	$0.100	$0.100
	文字輸出內容 (回覆和推理)	$2.50 美元	$2.50 美元	不適用	不適用
	圖片輸出***	$30 美元	$30 美元	不適用	不適用
Gemini 2.5 Flash Live API
	100 萬個輸入文字詞元	$0.5	$0.5	不適用	不適用
	100 萬個輸入音訊詞元	$3 美元	$3 美元	不適用	不適用
	100 萬個輸入影片/圖片詞元	$3 美元	$3 美元	不適用	不適用
	100 萬個輸出文字詞元	$2 美元	$2 美元	不適用	不適用
	100 萬個輸出音訊詞元	$12 美元	$12 美元	不適用	不適用
Gemini 2.5 Flash Lite
	輸入內容 (文字、圖片、影片)	$0.1 美元	$0.1 美元	$0.010 美元	$0.010 美元
	音訊輸入	$0.3 美元	$0.3 美元	$0.030 美元	$0.030 美元
	文字輸出內容 (回覆和推理)	$0.4	$0.4	不適用	不適用

優先順序

型號	類型	價格 (每 100 萬個詞元) <= 20 萬個輸入詞元 (優先)	價格 (每 100 萬個權杖) > 20 萬個輸入權杖 (優先)	價格 (每 100 萬個詞元) <= 20 萬個 cached 輸入詞元 (優先順序)	價格 (每 100 萬個詞元) > 20 萬個快取輸入詞元 (優先順序)
Gemini 2.5 Pro
	輸入內容 (文字、圖片、影片、音訊)	$ 2.25 美元	$4.5	$0.225	$0.45
	文字輸出內容 (回覆和推理)	$18 美元	$27	不適用	不適用
Gemini 2.5 Pro 電腦使用 - 預先發布版
	輸入內容 (文字、圖片、影片、音訊)	不適用	不適用	不適用	不適用
	文字輸出內容 (回覆和推理)	不適用	不適用	不適用	不適用
Gemini 2.5 Flash
	輸入內容 (文字、圖片、影片)	$0.54 美元	$0.54 美元	$0.054 美元	$0.054 美元
	音訊輸入	$1.8	$1.8	$0.18 美元	$0.18 美元
	文字輸出內容 (回覆和推理)	$4.5	$4.5	不適用	不適用
	圖片輸出***	不適用	不適用	不適用	不適用
Gemini 2.5 Flash Live API
	100 萬個輸入文字詞元	不適用	不適用	不適用	不適用
	100 萬個輸入音訊詞元	不適用	不適用	不適用	不適用
	100 萬個輸入影片/圖片詞元	不適用	不適用	不適用	不適用
	100 萬個輸出文字詞元	不適用	不適用	不適用	不適用
	100 萬個輸出音訊詞元	不適用	不適用	不適用	不適用
Gemini 2.5 Flash Lite
	輸入內容 (文字、圖片、影片)	$0.18 美元	$0.18 美元	$0.018 美元	$0.018 美元
	音訊輸入	$0.54 美元	$0.54 美元	$0.054 美元	$0.054 美元
	文字輸出內容 (回覆和推理)	$0.72 美元	$0.72 美元	不適用	不適用

彈性/批次

型號	類型	價格 (每 100 萬個詞元) <= 20 萬個輸入詞元 (搭配彈性/批次模式)	價格 (每 100 萬個詞元) > 20 萬個輸入詞元 (彈性/批次)
Gemini 2.5 Pro
	輸入內容 (文字、圖片、影片、音訊)	$0.625 美元	$1.25 美元
	文字輸出內容 (回覆和推理)	$5 美元	$7.5
Gemini 2.5 Pro 電腦使用 - 預先發布版
	輸入內容 (文字、圖片、影片、音訊)	不適用	不適用
	文字輸出內容 (回覆和推理)	不適用	不適用
Gemini 2.5 Flash
	輸入內容 (文字、圖片、影片)	$0.15 美元	$0.15 美元
	音訊輸入	$0.5	$0.5
	文字輸出內容 (回覆和推理)	$1.25 美元	$1.25 美元
	圖片輸出***	$15	$15
Gemini 2.5 Flash Live API
	100 萬個輸入文字詞元	不適用	不適用
	100 萬個輸入音訊詞元	不適用	不適用
	100 萬個輸入影片/圖片詞元	不適用	不適用
	100 萬個輸出文字詞元	不適用	不適用
	100 萬個輸出音訊詞元	不適用	不適用
Gemini 2.5 Flash Lite
	輸入內容 (文字、圖片、影片)	$0.05 美元	$0.05 美元
	音訊輸入	$0.15 美元	$0.15 美元
	文字輸出內容 (回覆和推理)	$0.2	$0.2

功能	定價
以 Google 搜尋建立基準	Gemini 2.0 Flash、2.5 Flash 和 2.5 Flash-Lite 方案每天提供 1,500 個錨定提示，不另收費。Gemini 2.5 Pro 方案每天提供 10,000 個錨定提示，不需額外付費。如超出上述限制，則每個 grounded 提示的費用為 $0.035 美元。建立基準的提示是指提交給 Gemini 的要求，會對 Google 搜尋發出一個或多個查詢&ast;&ast;。即使將多個搜尋查詢傳送至 Google 搜尋，接地提示也只會收取一次費用。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。
以企業適用的網路內容建立基準	每 1,000 個已建立基準的提示$45 美元。基礎提示是指提交給 Gemini 的要求，會對 Web Grounding for enterprise 發出一個或多個查詢**。即使將多個搜尋查詢傳送至 Google 搜尋，接地提示也只會收取一次費用。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。
以您的資料建立基準	每 1,000 個要求 $2.5 美元。
利用 Google 地圖建立基準	每 1,000 個基礎提示$25 美元。一個錨定提示是指傳送給 Gemini 的要求，其中至少包含 1 個 Google 地圖查詢。

* 如果查詢輸入內容的脈絡長度超過 20 萬個詞元，則所有詞元 (輸入和輸出內容) 都會按長脈絡費率計費。
** 只有在提示成功傳回網路結果 (即結果包含至少一個來自網路的基準支援網址) 時，才會針對 Google 搜尋基準和企業版網路基準功能收費。Gemini 模型用量費用另計。
*** 1024x1024 圖片會消耗 1290 個符元。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元，請參閱我們的說明文件。
**** 電腦使用費計費會使用 Gemini 2.5 Pro SKU，以區分電腦使用費，並套用計費標記。詳情請參閱這篇文章。

LiveAPI 工作階段背景資訊視窗計費說明：系統會針對工作階段背景資訊視窗中的所有權杖，按回合向您收費。工作階段脈絡視窗包含新權杖 (目前回合) + 前幾回合累積的所有權杖。也就是說，系統會重新處理過去輪次的權杖，並將其納入每個新輪次，直到達到您設定的脈絡視窗大小為止。「回合」是指使用者輸入內容和模型回覆。
主動式音訊模式：啟用後，LiveAPI 監聽時會收取輸入權杖費用。只有在 API 回應時，才會收取輸出詞元費用。
啟用音訊轉文字轉錄功能後，所有轉錄文字權杖都會按文字權杖輸出費率計費。

Gemini 2.0

Gemini 2.0 的計費方式是根據權杖數量。如要計算要求中的輸入詞元數量，再傳送要求，可以使用 SDK 分詞器或 countTokens API。如果要求失敗並傳回 400 或 500 錯誤，系統不會向您收取使用的權杖費用。

使用價目表中的切換鈕，比較根據權杖計費和根據模態計費的方案。

根據詞元計費

型號	類型	費用	Batch API 定價
Gemini 2.0 Flash
	100 萬個輸入詞元	$0.15 美元	$0.075 美元
	100 萬個輸入音訊詞元	$1.00 美元	$0.50 美元
	100 萬個輸出文字詞元	$0.60 美元	$0.30 美元
	微調 100 萬個訓練符元	$3.00 美元
Gemini 2.0 Flash Image Generation
	100 萬個輸入詞元	$0.15 美元
	100 萬個輸入音訊詞元	$1.00 美元
	100 萬個輸入影片詞元	$3 美元
	100 萬個輸出文字詞元	$0.60 美元
	100 萬個輸出圖像詞元	$30.00
Gemini 2.0 Flash Live API
	100 萬個輸入文字詞元	$0.5
	100 萬個輸入音訊詞元	$3 美元
	100 萬個輸入影片/圖片詞元	$3 美元
	100 萬個輸出文字詞元	$2 美元
	100 萬個輸出音訊詞元	$12 美元
Gemini 2.0 Flash Lite
	100 萬個輸入詞元	$0.075 美元	$0.0375 美元
	100 萬個輸入音訊詞元	$0.075 美元	$0.0375 美元
	100 萬個輸出文字詞元	$0.30 美元	$0.15 美元
	微調 100 萬個訓練符元	$1.00 美元
以 Google 搜尋建立基準	Gemini 2.0 Flash 和 2.5 Flash 方案每天提供 1,500 個錨定提示，不需額外付費。如超出上述限制，則根據每 1,000 個基礎提示$35 美元計費。以 Google 搜尋為基準的提示，是指提交給 Gemini 的要求，會對 Google 搜尋發出一個或多個查詢*。即使將多個搜尋查詢傳送至 Google 搜尋，接地提示也只會收取一次費用。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。
以企業適用的網路內容建立基準	每 1,000 個已建立基準的提示$45 美元。錨定提示是指提交給 Gemini 的要求，會向 Web Grounding for enterprise* 發出一個或多個查詢。即使將多個搜尋查詢傳送至 Google 搜尋，接地提示也只會收取一次費用。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。
以您的資料建立基準	2025 年 6 月 16 日起，每 1,000 個要求 $2.5 美元。
運用 Google 地圖建立基準	Gemini 模型包含多項每日基礎提示，不需額外付費： Gemini Flash 和 Flash-Lite：每日共 1,500 個錨定提示。 Gemini Pro：每天 10,000 個基礎提示。超出上述限制的基礎提示，將按每 1,000 個基礎提示$25 美元計費。一個基礎提示是指傳送給 Gemini 的要求，其中至少包含 1 個 Google 地圖查詢。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。

根據模態計費

以下模態定價僅供參考，是根據平均應用實例計算而得。實際計費方式只會根據權杖數量：

4 個字元約等於 1 個文字權杖 (含空格)。

舉例來說，1024x1024 圖片會消耗 1290 個權杖。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元，請參閱我們的說明文件。

在每秒一影格的取樣率下，影片輸入內容每秒會消耗 258 個權杖。含音訊的影片會同時產生影片和音訊權杖的費用。

沒有時間戳記的音訊輸入內容，每秒會消耗 25 個符元。

型號	類型	費用	Batch API 定價
Gemini 2.0 Flash
	輸入文字 (每百萬字元)	$0.0375 美元	$0.01875
	輸入圖片 (每張圖片的費用)	$0.0001935	$0.00009675
	輸入影片 ($/秒)	$0.0000387 美元	$0.00001935
	輸入音訊 ($/秒)	$0.000025	$0.0000125
	輸出文字 (每 100 萬字元)	$0.15 美元	$0.075 美元
Gemini 2.0 Flash Image Generation
	輸入文字 (每百萬字元)	$0.0375 美元
	輸入圖片 (每張圖片的費用)	$0.0001935
	輸入影片 ($/秒)	$0.0000387 美元
	輸入音訊 ($/秒)	$0.000025
	輸出文字 (每 100 萬字元)	$0.15 美元
	輸出圖片 ($/圖片)	$0.04 美元
Gemini 2.0 Flash Lite
	輸入文字 (每百萬字元)	$0.01875	$0.009375
	輸入圖片 (每張圖片的費用)	$0.00009675	$0.000048375
	輸入影片 ($/秒)	$0.00001935	$0.000009675
	輸入音訊 ($/秒)	$0.000001875	$0.000000938
	輸出文字 (每 100 萬字元)	$0.075 美元	$0.0375 美元
以 Google 搜尋建立基準	Gemini 2.0 Flash 和 2.5 Flash 方案每天提供 1,500 個錨定提示，不需額外付費。如超出上述限制，則根據每 1,000 個基礎提示$35 美元計費。以 Google 搜尋為基準的提示，是指提交給 Gemini 的要求，會對 Google 搜尋發出一個或多個查詢*。即使將多個搜尋查詢傳送至 Google 搜尋，接地提示也只會收取一次費用。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。
以企業適用的網路內容建立基準	每 1,000 個已建立基準的提示$45 美元。錨定提示是指提交給 Gemini 的要求，會向 Web Grounding for enterprise* 發出一個或多個查詢。即使將多個搜尋查詢傳送至 Google 搜尋，接地提示也只會收取一次費用。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。

* 價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。
* PDF 會以圖像輸入計費，一個 PDF 頁面相當於一張圖像。
* 微調模型端點的預測價格與基礎模型相同。
* 只有在提示成功傳回網頁結果 (即結果包含至少一個來自網路的基準支援網址) 時，才會針對 Google 搜尋基準和企業版網頁基準計費。Gemini 模型用量費用另計。
* Gemini 2.0 Flash Live API：每秒音訊 (輸入/輸出) 25 個詞元、每秒影片 (輸入) 258 個詞元。Gemini 2.0 Flash Live API 仍為預先發布版，因此使用 Google 搜尋建立基準仍不需付費。

LiveAPI 工作階段背景資訊視窗計費說明：系統會針對工作階段背景資訊視窗中的所有權杖，按回合向您收費。工作階段脈絡視窗包含新權杖 (目前回合) + 前幾回合累積的所有權杖。也就是說，系統會重新處理過去輪次的權杖，並將其納入每個新輪次，直到達到您設定的脈絡視窗大小為止。「回合」是指使用者輸入內容和模型回覆。
啟用音訊轉文字轉錄功能後，所有轉錄文字權杖都會按文字權杖輸出費率計費。

Vertex AI Model Optimizer 定價 (實驗性)*

Vertex AI Model Optimizer 提供單一中繼端點，可處理 Gemini 模型要求，讓企業客戶輕鬆使用 Gemini，不必指定要使用 Flash、Pro 或特定版本。他們只需設定偏好選項 (成本、品質或平衡)，Model Optimizer 就會將每項查詢傳送至最適合的模型，並套用適當的智慧程度來完成工作。

Vertex AI Model Optimizer 採用動態定價。也就是說，每個符記的平均價格取決於完成工作時所套用的模型智慧等級。因此，我們在下方提供定價範例，說明根據設定可能發生的情況 (請參閱下表)。Model Optimizer SKU 是 $1 美元的 SKU，可做為計費的購買單位，使用模型後仍會依用量計費。

I/O 比率為 5:1	範例 1 聊天機器人	注意：這些範圍並非保證，個別客戶的成效可能有所不同
顧客偏好	傳送至 MO 的顧客輸入權杖	傳送至行銷目標的客戶輸出權杖	每百萬個輸入詞元的平均價格 (高範圍)	每百萬個詞元的平均輸出價格 (高範圍)	每百萬個輸入權杖的平均價格 (低範圍)	每百萬個輸出權杖的平均輸出價格 (低範圍)
費用	10,000,000	2,000,000	$0.63 美元	$2.50 美元	$0.16 美元	$0.63 美元
平衡	10,000,000	2,000,000	$1.26 美元	$5.00 美元	$0.63 美元	$2.50 美元
品質	10,000,000	2,000,000	$1.89	$7.50	$1.26 美元	$5.00 美元

I/O 比率 1:20	範例 2：生成內容
顧客偏好	傳送至 MO 的顧客輸入權杖	傳送至行銷目標的客戶輸出權杖	每百萬個輸入詞元的平均價格 (高範圍)	每百萬個詞元的平均輸出價格 (高範圍)	每百萬個輸入權杖的平均價格 (低範圍)	每百萬個輸出權杖的平均輸出價格 (低範圍)
費用	1,000,000	20,000,000	$0.63 美元	$2.50 美元	$0.16 美元	$0.63 美元
平衡	1,000,000	20,000,000	$1.26 美元	$5.00 美元	$0.63 美元	$2.50 美元
品質	1,000,000	20,000,000	$1.89	$7.50	$1.26 美元	$5.00 美元

* Model Optimizer 是付費實驗性產品，可能會將要求轉送至 Vertex 上的 Gemini 實驗版本。

其他 Gemini 模型

Gemini 2.0 和 Gemini 2.5 以外的所有 Gemini 模型，都是根據字元、圖片、影片/音訊秒數等模態計費。文字輸入內容的計費方式為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回覆)。字元數是根據 UTF-8 碼位計算，且不含空白字元，因此每個符記約有 4 個字元。如果預測要求導致回應遭篩除，系統只會針對輸入內容收費。每個帳單週期結束時，系統會將未滿一美分 ($0.01) 的金額四捨五入至一美分。媒體輸入內容的計費方式為每張圖片或每秒 (影片)。如果要求失敗並傳回 400 或 500 錯誤，系統不會向您收取使用的權杖費用。

型號	功能	類型	價格 ( =< 128K input tokens)	價格 (輸入詞元數 > 128,000)
Gemini 1.5 Flash	多模態	圖片輸入影片輸入文字輸入音訊輸入	每張圖片 $0.00002 美元每秒$0.00002 美元每 1,000 個字元$0.00001875 美元每秒$0.000002 美元	每張圖片 $0.00004 美元每秒$0.00004 美元每 1,000 個字元$0.0000375 美元每秒$0.000004 美元
		文字輸出	每 1,000 個字元 $0.000075 美元	每 1,000 個字元 $0.00015
	調整*	訓練權杖	每 100 萬個詞元 $8 美元
Gemini 1.5 Pro	多模態	圖片輸入影片輸入文字輸入音訊輸入	每張圖片 $0.00032875 美元每秒$0.00032875 美元每 1,000 個字元$0.0003125 美元每秒$0.00003125 美元	每張圖片 $0.0006575 美元每秒$0.0006575 美元每 1,000 個字元$0.000625 美元每秒$0.0000625 美元
		文字輸出	每 1,000 個字元 $0.00125	每 1,000 個字元 $0.0025 美元
	調整*	訓練權杖	每 100 萬個詞元 $80 美元
Gemini 1.0 Pro	多模態	圖片輸入影片輸入文字輸入	每張圖片 $0.0025 美元每秒$0.002 美元每 1,000 個字元$0.000125 美元
Gemini 1.0 Pro		文字輸出	每 1,000 個字元 $0.000375 美元
以 Google 搜尋建立基準	文字	每 1,000 個基礎提示$35 美元。以 Google 搜尋為基準的提示，是指提交給 Gemini 的要求，會對 Google 搜尋發出一個或多個查詢*。即使將多個搜尋查詢傳送至 Google 搜尋，接地提示也只會收取一次費用。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。
以企業適用的網路內容建立基準	文字	每 1,000 個已建立基準的提示$45 美元。 A grounded prompt is a request submitted to Gemini that makes one or more queries to Web Grounding for enterprise*. 即使將多個搜尋查詢傳送至 Google 搜尋，接地提示也只會收取一次費用。如果每天需要超過 100 萬個基礎提示，請與帳戶團隊聯絡。
以您的資料建立基準	文字	2025 年 6 月 16 日起，每 1,000 項要求 $2.5 美元。

* 價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 如果查詢脈絡長度超過 128, 000 個詞元，所有詞元都會以長脈絡費率計費。
* Gemini 模型在批次模式中提供 50% 折扣。
* Gemini 1.0 Pro 僅支援最多 32,000 個詞元的脈絡窗口。
* PDF 會以圖像輸入計費，一個 PDF 頁面相當於一張圖像。
* 微調模型端點的預測價格與基礎模型相同。
* 只有在提示成功傳回網頁結果 (即結果包含至少一個來自網路的基準支援網址) 時，才會針對 Google 搜尋基準和企業版網頁基準功能收費。Gemini 模型用量費用另計。

Imagen

有了 Vertex AI 的 Imagen，您可以根據提供的文字提示生成全新圖像和編輯圖像，也可以使用定義的遮罩區域編輯圖像的特定部分，以及使用其他多項功能。

型號	功能	說明	輸入內容	輸出內容	價格
Imagen 4 Ultra	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.06 美元
Imagen 4	提高解析度	將生成圖片的解析度提高至 2K、3K 和 4K	圖片	圖片	每張圖片 $0.06 美元
Imagen 4	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.04 美元
Imagen 4 Fast	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.02 美元
Imagen 3	圖像生成	生成圖片編輯圖片自訂圖片	文字提示	圖片	每張圖片 $0.04 美元
Imagen 3 Fast	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.02 美元
Imagen 2、Imagen 1	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.020 美元
Imagen 2、Imagen 1	圖像編輯	使用無遮罩或遮罩方法編輯圖片	圖像/文字提示	圖片	每張圖片 $0.020 美元
Imagen 1	提高解析度	將生成圖片的解析度提高至 2K 和 4K	圖片	圖片	每張圖片 $0.003 美元
Imagen 1	微調	啟用使用者提供的「主體」，用於 Imagen 提示 (少量樣本訓練)	主體附有文字識別碼，每個主體有 4 到 8 張圖片	微調模型 (使用使用者提供的科目訓練後)	每節點時數價格 (Vertex AI 自訂訓練定價)
Imagen	圖像說明生成	生成圖像的短篇或長篇說明文字	圖片	文字說明	每張圖片 $0.0015 美元
Imagen	圖像問題回答	根據參考圖片的問題提供答案	圖像/文字提示	文字答案	每張圖片 $0.0015 美元
Imagen	Product Recontext	在全新場景中重新構思產品	1-3 張相同產品的圖片，以及描述所需場景的文字提示	圖片	每張圖片 $0.12 美元
	Vertex 虛擬試穿	生成穿著不同服飾的人物圖像	1 張人物圖片和 1 張服飾圖片	圖片	每張圖片 $0.06 美元

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

Veo

Veo 能生成各種主題和風格的超高畫質影片，更精準掌握真實物理效果，以及人類動作和表情的細微變化。

型號	功能	說明	輸入	輸出	輸出解析度	費用
Veo 3.1	生成影片和音訊	根據文字提示或參考圖片，生成高品質影片，並同步加入語音/音效	文字/圖像提示	影片 + 音訊	720p、1080p	每秒 $0.40 美元
	生成影片和音訊	根據文字提示或參考圖片，生成高品質影片，並同步加入語音/音效	文字/圖像提示	影片 + 音訊	4K	每秒 $0.60 美元
	影片生成	根據文字提示或參考圖片生成高畫質影片	文字/圖像提示	影片	720p、1080p	每秒 $0.20 美元
	影片生成	根據文字提示或參考圖片生成高畫質影片	文字/圖像提示	影片	4K	每秒 $0.40 美元
Veo 3.1 Fast	生成影片和音訊	根據文字提示或參考圖片，快速生成影片並同步加入語音/音效	文字/圖像提示	影片 + 音訊	720p、1080p	每秒 $0.15 美元
	生成影片和音訊	根據文字提示或參考圖片，快速生成影片並同步加入語音/音效	文字/圖像提示	影片 + 音訊	4K	每秒 $0.35 美元
	影片生成	根據文字提示或參考圖片，更快生成影片	文字/圖像提示	影片	720p、1080p	每秒 $0.10 美元
	影片生成	根據文字提示或參考圖片，更快生成影片	文字/圖像提示	影片	4K	每秒 $0.30 美元
Veo 3	生成影片和音訊	根據文字提示或參考圖片，生成高品質影片，並同步加入語音/音效	文字/圖像提示	影片 + 音訊	720p、1080p	每秒 $0.40 美元
Veo 3	影片生成	根據文字提示或參考圖片生成高畫質影片	文字/圖像提示	影片	720p、1080p	每秒 $0.20 美元
Veo 3 Fast	生成影片和音訊	根據文字提示或參考圖片，快速生成影片並同步加入語音/音效	文字/圖像提示	影片 + 音訊	720p、1080p	每秒 $0.15 美元
Veo 3 Fast	影片生成	根據文字提示或參考圖片，更快生成影片	文字/圖像提示	影片	720p、1080p	每秒 $0.10 美元
Veo 2	影片生成	根據文字提示或參考圖片生成影片	文字/圖像提示	影片	720p	每秒 $0.50 美元
Veo 2	進階控制項	透過開頭和結尾畫面插補生成影片、延長生成影片，以及套用攝影機控制項	文字/圖片/影片提示	影片	720p	每秒 $0.50 美元

Lyria

Lyria 2 可生成高品質的器樂音樂，非常適合用於精緻的作曲和細膩的創意探索，生成細微的輸出內容。

型號	功能	說明	輸入	輸出	費用
Lyria 2	音樂生成	根據文字提示生成音樂	文字提示	音樂	每 30 秒 $0.06 美元

瞭解 AI 應用程式的嵌入費用

型號	類型	區域	每 1,000 個輸入詞元的價格
Gemini Embedding	輸入	全球	線上要求：$0.00015 批次要求：$0.00012
Gemini Embedding	輸出	全球	線上申請：免費批次要求：免付費

型號	類型	區域	每 1,000 個字元的價格
文字嵌入 (不含 Gemini 嵌入)	輸入	全球	線上要求：$0.000025 批次要求：$0.00002
文字嵌入 (不含 Gemini 嵌入)	輸出	全球	線上申請：免費批次要求：免付費

型號	功能	說明	輸入內容	輸出內容	價格
multimodalembedding	多模態嵌入：文字	使用文字做為輸入內容來生成嵌入	文字	嵌入	每輸入 1,000 個字元 $0.0002 美元
	多模態嵌入：圖像	使用圖片做為輸入內容，生成嵌入	圖片	嵌入	每張輸入圖片 $0.0001 美元
	多模態嵌入：Video Plus	Video Plus	影片	嵌入 (每分鐘影片最多 15 個嵌入)	每秒影片 $0.0020 美元
	多模態嵌入：Video Standard	Video Standard	影片	嵌入 (每分鐘影片最多 8 個嵌入)	每秒影片 $0.0010 美元
	多模態嵌入：影片基本概念	影片必備功能	影片	嵌入 (每分鐘影片最多 4 個嵌入)	每秒影片 $0.0005 美元

開放原始碼模型	類型	每 1,000 個輸入詞元的價格
multilingual-e5-small	輸入內容：輸出內容：批次輸入內容：批次輸出內容：	線上要求：$0.000015 線上要求：免付費批次要求：$0.0000075 批次要求：免付費
multilingual-e5-large	輸入內容：輸出內容：批次輸入內容：批次輸出內容：	線上要求：$0.000025 線上要求：免費批次要求：$0.0000125 批次要求：免費

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

Vertex AI 程式碼補全功能的定價

Vertex AI 生成式 AI 的計費方式為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回覆)。字元數是根據 UTF-8 碼位計算，且不含空白字元。預先發布期間，費用可享 100% 折扣。如果預測要求導致回應遭篩選，系統只會針對輸入內容收費。每個帳單週期結束時，系統會將未滿一美分 ($0.01) 的金額四捨五入至一美分。

型號	類型	區域	每 1,000 個字元的價格
Codey：完成程式碼	輸入	全球	線上要求：$0.00025
Codey：完成程式碼	輸出	全球	線上要求：$0.0005

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

翻譯 (文字)

使用 Vertex AI API 和 Translation LLM 翻譯文字。LLM 翻譯的內容通常比傳統翻譯模型更流暢，聽起來更像人類說的話，但支援的語言較少(瞭解詳情)。

型號	方法	用量	每 100 萬個字元的價格
LLM	文字翻譯^*	每月輸入字元數	每 100 萬個字元 $10 美元^*
	文字翻譯^*	每月輸出字元數	每 100 萬個字元 $10 美元^*

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
^*價格為模型處理的每個字元單價。如要進一步瞭解如何計算字元數，請參閱計費字元

明確快取脈絡快取儲存空間的價格

型號	功能	類型	價格 (每 100 萬個符記) <= 20 萬個輸入符記	價格 (每 100 萬個符記) > 20 萬個輸入符記
Gemini 3 Pro	脈絡快取儲存空間	輸入內容 (文字、圖片、影片、音訊)	每小時每百萬個權杖 $4.5 美元	每小時每百萬個權杖 $4.5 美元
Gemini 2.5 Pro	脈絡快取儲存空間	輸入內容 (文字、圖片、影片、音訊)	每小時每百萬個權杖 $4.5 美元	每小時每百萬個權杖 $4.5 美元
Gemini 2.5 Flash	脈絡快取儲存空間	輸入內容 (文字、圖片、影片、音訊)	$1 (每百萬權杖每小時)	$1 (每百萬權杖每小時)
Gemini 2.5 Flash Lite	脈絡快取儲存空間	輸入內容 (文字、圖片、影片、音訊)	$1 (每百萬權杖每小時)	$1 (每百萬權杖每小時)

Gemini 2.0 模型

根據權杖計費

模型	類型	儲存空間 (百萬權杖小時)	費用
Gemini 2.0 Flash
	100 萬個輸入詞元	$1.00 美元	$0.0375 美元
	100 萬個輸入音訊詞元	$1.00 美元	$0.25 美元
	100 萬個輸出文字詞元	不適用	不適用
Gemini 2.0 Flash Lite
	100 萬個輸入詞元	$1.00 美元	$0.01875
	100 萬個輸入音訊詞元	$1.00 美元	$0.01875
	100 萬個輸出文字詞元	不適用	不適用

根據模態計費

以下模態定價僅供參考，是根據平均應用實例計算而得。實際計費方式只會根據權杖數量：

4 個字元約等於 1 個文字權杖 (含空格)。

舉例來說，1024x1024 圖片會消耗 1290 個權杖。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元，請參閱我們的說明文件。

在每秒一影格的取樣率下，影片輸入內容每秒會消耗 258 個權杖。含音訊的影片會同時產生影片和音訊權杖的費用。

沒有時間戳記的音訊輸入內容，每秒會消耗 25 個符元。

模型	類型	儲存空間 (模態-小時)	價格
Gemini 2.0 Flash
	輸入文字 (每百萬字元)	$0.25 美元	$0.009375
	輸入圖片 (每張圖片的費用)	$0.00129	$0.000048375
	輸入影片 ($/秒)	$0.000258	$0.000009675
	輸入音訊 ($/秒)	$0.000025	$0.00000625
	輸出文字 (每 100 萬字元)	不適用	不適用
Gemini 2.0 Flash Lite
	輸入文字 (每百萬字元)	$0.25 美元	$0.0046875
	輸入圖片 (每張圖片的費用)	$0.00129	$0.0000241875
	輸入影片 ($/秒)	$0.000258	$0.000009675
	輸入音訊 ($/秒)	$0.000258	$0.0000048375
	輸出文字 (每 100 萬字元)	不適用	不適用
以 Google 搜尋建立基準	Gemini 2.0 Flash 每天最多可處理 1,500 個基礎要求，不需額外付費。每日超過 1,500 次的基礎要求，每 1,000 次要求將收取 $35 美元 (每日最多 100 萬次要求)。如果每天需要超過 100 萬次要求，請與帳戶團隊聯絡。
以企業適用的網路內容建立基準	自 2025 年 5 月 5 日起，每 1,000 個要求 $45 美元 (每天最多 100 萬個要求)。如果每天需要超過 100 萬次要求，請與帳戶團隊聯絡。

* 價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* PDF 會以圖像輸入計費，一個 PDF 頁面相當於一張圖像。
* 微調模型端點的預測價格與基礎模型相同。
* 只有在要求傳回的結果包含至少一個來自網路的基礎支援網址時，才會針對 Google 搜尋基礎功能收費。此外，您也必須支付標準 Gemini 模型使用費。

佈建輸送量

佈建的處理量可確保生成式 AI 需求獲得足夠的處理量，交易單位為生成式 AI 擴充單元 (GSU)。如要進一步瞭解各項 GSU 提供的輸送量，請按這裡並使用我們的線上估算工具，請按這裡。

時間長度	每單位 GSU 價格	每
1 週承諾	$1,200	週
綁約 1 個月	$2,700	月
綁約 3 個月	$2,400	月
1 年承諾使用合約	$2,000 美元	月

費用計算範例

使用者需要確保 gemini-2.0-flash 能支援每秒 10 次查詢 (QPS)，且每次查詢的輸入內容為 1,000 個文字權杖和 500 個音訊權杖，輸出內容為 300 個文字權杖。

根據 gemini-2.0-flash 的輸送量和消耗率表，我們知道輸入文字詞元的消耗率為 1 個詞元、輸入音訊詞元的消耗率為 7 個詞元，而輸出文字詞元的消耗率為 4 個詞元。

使用者的輸入詞元總數為 1,000* (每個輸入文字詞元 1 個詞元) + 500* (每個輸入音訊詞元 7 個詞元) = 4,500 個 (經用量遞減調整)。使用者的輸出詞元總數為 300* (每個輸出文字詞元 4 個詞元) = 1,200 個調整後的輸出詞元。將兩者相加，得出 4,500 個經調整的輸入詞元 + 1,200 個經調整的輸出詞元 = 5,700 個查詢總詞元。

將每項查詢的總權杖數乘以 QPS，即可得出每秒總權杖數：5,700 個總權杖數/查詢 * 10 QPS = 57,000 個總權杖數/秒。

將這個數字除以每個 GSU 每秒的總處理量，即可得出 57,000 個每秒總詞元數 ÷ 每個 GSU 每秒 3,360 個處理量 = 16.96 個 GSU。這個模型的最低 GSU 購買增量為 1，因此使用者需要 17 個 GSU。

如果使用者想維持這個輸送量 1 週，費用將為 $1,200 美元 * 17 個 GSU = 每週 $20,400 美元。如果他們想維持這個輸送量 1 個月，費用將為 $2,700 * 17 個 GSU = 每月 $45,900 美元。如果他們想維持這個輸送量 3 個月，每月費用將為 $2,400 * 17 GSUs = $40,800。最後，如果他們想維持這個輸送量 1 年，每個月的費用將是 $2,000 * 17 GSUs = $34,000。

模型調整

模型調整是根據任務自訂大型模型的有效方法。這是提升模型品質和效率的關鍵步驟。模型微調有下列好處：

針對特定工作提供更高品質的輸出內容
提升模型穩健性
提示較短，因此推論延遲時間和成本較低

調整作業會按每百萬個訓練詞元計費。訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。在模型推論方面，Gemini 微調模型端點的預測價格與基礎模型相同。

型號	類型	價格 (每 100 萬個訓練權杖)
Gemini 2.5 Pro	監督式微調	$25
Gemini 2.5 Flash	監督式微調偏好調整	$5 美元
Gemini 2.5 Flash Lite	監督式微調偏好調整	$1.5
Gemma 3 27B IT	監督式微調	$6.83
Llama 3.1 8B	監督式微調	$0.67
Llama 3.2 1B	監督式微調	$0.28
Llama 3.2 3B	監督式微調	$0.61
Llama 3.3 70B	監督式微調	$6.72
Llama 4 Scout 17B 16E	監督式微調	$5.77
Qwen 3 32B	監督式微調	$6.57

* 訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。
* Gemini 微調模型端點的預測價格與基礎模型相同。

比較 Vertex AI 合作夥伴模型的定價

合作夥伴模型是 Google 合作夥伴開發的精選生成式 AI 模型。合作夥伴模型以代管 API 形式提供。詳情請參閱合作夥伴模型總覽。以下各節列出 Google 合作夥伴模型的定價詳細資料。

AI21 Labs 的模型

型號	定價
Jamba 1.5 Large (已淘汰)	輸入：每 100 萬個詞元 $2 美元輸出：每 100 萬個詞元 $8 美元
Jamba 1.5 Mini (已淘汰)	輸入：每 100 萬個詞元 $0.20 美元輸出：每 100 萬個詞元 $0.40 美元

Anthropic 的 Claude 模型

提供區域定價的機型

全球

型號	價格 (每 100 萬個符記) =< 20 萬個輸入符記	價格 (每 100 萬個權杖) > 20 萬個輸入權杖
Claude Opus 4.6	輸入：$5.00 美元輸出：$25.00 美元批次輸入：$2.50 美元批次輸出：$12.50 美元 5 分鐘快取寫入：$6.25 美元 1 小時快取寫入：$10.00 美元快取命中：$0.50 美元 5 分鐘批次快取寫入：$3.13 美元 1 小時批次快取寫入：$5.00 美元批次快取命中：$0.25 美元	輸入：$10.00 輸出：$37.50 5 分鐘快取寫入：$12.50 1 小時快取寫入：$20.00 快取命中：$1.00
Claude Opus 4.5	輸入：$5.00 輸出：$25.00 批次輸入：$2.50 批次輸出：$12.50 5 分鐘快取寫入：$6.25 1 小時快取寫入：$10.00 快取命中：$0.50 5 分鐘批次快取寫入：$3.125 1 小時批次快取寫入：$5.00 批次快取命中：$0.25
Claude Sonnet 4.5	輸入：$3.00 美元輸出：$15.00 美元批次輸入：$1.50 美元批次輸出：$7.50 美元 5 分鐘快取寫入：$3.75 美元 1 小時快取寫入：$6.00 美元快取命中：$0.30 美元 5 分鐘批次快取寫入：$1.88 美元 1 小時批次快取寫入：$3.00 美元批次快取命中：$0.15 美元	輸入：$6.00 輸出：$22.50 5 分鐘快取寫入：$7.50 1 小時快取寫入：$12.00 快取命中：$0.60
Claude Haiku 4.5	輸入：$1.00 美元輸出：$5.00 美元批次輸入：$0.50 美元批次輸出：$2.50 美元 5 分鐘快取寫入：$1.25 美元 1 小時快取寫入：$2.00 美元快取命中：$0.10 美元 5 分鐘批次快取寫入：$0.625 美元 1 小時批次快取寫入：$1.00 美元批次快取命中：$0.05 美元

us-east5

型號	價格 (每 100 萬個符記) =< 20 萬個輸入符記	價格 (每 100 萬個權杖) > 20 萬個輸入權杖
Claude Opus 4.6	輸入：$5.50 輸出：$27.50 批次輸入：$2.75 批次輸出：$13.75 5 分鐘快取寫入：$6.88 1 小時快取寫入：$11.00 快取命中：$0.55 5 分鐘批次快取寫入：$3.44 1 小時批次快取寫入：$5.50 批次快取命中：$0.28	輸入：$11.00 輸出：$41.25 5 分鐘快取寫入：$13.75 1 小時快取寫入：$22.00 快取命中：$1.10
Claude Opus 4.5	輸入：$5.50 美元輸出：$27.50 美元批次輸入：$2.75 美元批次輸出：$13.75 美元 5 分鐘快取寫入：$6.875 美元 1 小時快取寫入：$11.00 美元快取命中：$0.55 美元 5 分鐘批次快取寫入：$3.438 美元 1 小時批次快取寫入：$5.50 美元批次快取命中：$0.275 美元
Claude Sonnet 4.5	輸入：$3.30 美元輸出：$16.50 美元批次輸入：$1.65 美元批次輸出：$8.25 美元 5 分鐘快取寫入：$4.13 美元 1 小時快取寫入：$6.60 美元快取命中：$0.33 美元 5 分鐘批次快取寫入：$2.06 美元 1 小時批次快取寫入：$3.30 美元批次快取命中：$0.17 美元	輸入：$6.60 美元輸出：$24.75 美元 5 分鐘快取寫入：$8.25 美元 1 小時快取寫入：$13.20 美元快取命中：$0.66 美元
Claude Haiku 4.5	輸入：$1.10 美元輸出：$5.50 美元批次輸入：$0.55 美元批次輸出：$2.75 美元 5 分鐘快取寫入：$1.375 美元 1 小時快取寫入：$2.20 美元快取寫入：$1.375 美元快取命中：$0.11 美元 5 分鐘批次快取寫入：$0.688 美元 1 小時批次快取寫入：$1.10 美元批次快取命中：$0.055 美元

europe-west1

型號	價格 (每 100 萬個符記) =< 20 萬個輸入符記	價格 (每 100 萬個權杖) > 20 萬個輸入權杖
Claude Opus 4.6	輸入：$5.50 輸出：$27.50 批次輸入：$2.75 批次輸出：$13.75 5 分鐘快取寫入：$6.88 1 小時快取寫入：$11.00 快取命中：$0.55 5 分鐘批次快取寫入：$3.44 1 小時批次快取寫入：$5.50 批次快取命中：$0.28	輸入：$11.00 輸出：$41.25 5 分鐘快取寫入：$13.75 1 小時快取寫入：$22.00 快取命中：$1.10
Claude Opus 4.5	輸入：$5.50 美元輸出：$27.50 美元批次輸入：$2.75 美元批次輸出：$13.75 美元 5 分鐘快取寫入：$6.875 美元 1 小時快取寫入：$11.00 美元快取命中：$0.55 美元 5 分鐘批次快取寫入：$3.438 美元 1 小時批次快取寫入：$5.50 美元批次快取命中：$0.275 美元
Claude Sonnet 4.5	輸入：$3.30 美元輸出：$16.50 美元批次輸入：$1.65 美元批次輸出：$8.25 美元 5 分鐘快取寫入：$4.13 美元 1 小時快取寫入：$6.60 美元快取命中：$0.33 美元 5 分鐘批次快取寫入：$2.06 美元 1 小時批次快取寫入：$3.30 美元批次快取命中：$0.17 美元	輸入：$6.60 美元輸出：$24.75 美元 5 分鐘快取寫入：$8.25 美元 1 小時快取寫入：$13.20 美元快取命中：$0.66 美元
Claude Haiku 4.5	輸入：$1.10 美元輸出：$5.50 美元批次輸入：$0.55 美元批次輸出：$2.75 美元 5 分鐘快取寫入：$1.375 美元 1 小時快取寫入：$2.20 美元快取命中：$0.11 美元 5 分鐘批次快取寫入：$0.688 美元 1 小時批次快取寫入：$1.10 美元批次快取命中：$0.055 美元

asia-southeast1

型號	價格 (每 100 萬個符記) =< 20 萬個輸入符記	價格 (每 100 萬個權杖) > 20 萬個輸入權杖
Claude Opus 4.6	輸入：$5.50 輸出：$27.50 批次輸入：$2.75 批次輸出：$13.75 5 分鐘快取寫入：$6.88 1 小時快取寫入：$11.00 快取命中：$0.55 5 分鐘批次快取寫入：$3.44 1 小時批次快取寫入：$5.50 批次快取命中：$0.28	輸入：$11.00 輸出：$41.25 5 分鐘快取寫入：$13.75 1 小時快取寫入：$22.00 快取命中：$1.10
Claude Opus 4.5	輸入：$5.50 美元輸出：$27.50 美元批次輸入：$2.75 美元批次輸出：$13.75 美元 5 分鐘快取寫入：$6.875 美元 1 小時快取寫入：$11.00 美元快取命中：$0.55 美元 5 分鐘批次快取寫入：$3.438 美元 1 小時批次快取寫入：$5.50 美元批次快取命中：$0.275 美元
Claude Sonnet 4.5	輸入：$3.30 美元輸出：$16.50 美元批次輸入：$1.65 美元批次輸出：$8.25 美元 5 分鐘快取寫入：$4.13 美元 1 小時快取寫入：$6.60 美元快取命中：$0.33 美元 5 分鐘批次快取寫入：$2.06 美元 1 小時批次快取寫入：$3.30 美元批次快取命中：$0.17 美元	輸入：$6.60 美元輸出：$24.75 美元 5 分鐘快取寫入：$8.25 美元 1 小時快取寫入：$13.20 美元快取命中：$0.66 美元

asia-east1

型號	價格 (每 100 萬個符記) =< 20 萬個輸入符記	價格 (每 100 萬個權杖) > 20 萬個輸入權杖
Claude Haiku 4.5	輸入：$1.10 美元輸出：$5.50 美元批次輸入：$0.55 美元批次輸出：$2.75 美元 5 分鐘快取寫入：$1.375 美元 1 小時快取寫入：$2.20 美元快取命中：$0.11 美元 5 分鐘批次快取寫入：$0.688 美元 1 小時批次快取寫入：$1.10 美元批次快取命中：$0.055 美元

* 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元，則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。

所有區域的價格都相同的模型

型號	價格 (每 100 萬個符記) =< 20 萬個輸入符記	價格 (每 100 萬個權杖) > 20 萬個輸入權杖
Claude Opus 4.1	輸入：$15 美元輸出：$75 美元批次輸入：$7.50 美元批次輸出：$37.50 美元 5 分鐘快取寫入：$18.75 美元 1 小時快取寫入：$30 美元快取命中：$1.50 美元 5 分鐘批次快取寫入：$9.375 美元 1 小時批次快取寫入：$15.00 美元批次快取命中：$0.75 美元	不適用
Claude Opus 4	輸入：$15 美元輸出：$75 美元批次輸入：$7.50 美元批次輸出：$37.50 美元 5 分鐘快取寫入：$18.75 美元 1 小時快取寫入：$30 美元快取命中：$1.50 美元 5 分鐘批次快取寫入：$9.375 美元 1 小時批次快取寫入：$15.00 美元批次快取命中：$0.75 美元	不適用
Claude Sonnet 4	輸入：$3 美元輸出：$15 美元批次輸入：$1.50 美元批次輸出：$7.50 美元 5 分鐘快取寫入：$3.75 美元 1 小時快取寫入：$6.00 美元快取命中：$0.30 美元 5 分鐘批次快取寫入：$1.875 美元 1 小時批次快取寫入：$3.00 美元批次快取命中：$0.15 美元
Claude 3 Haiku	輸入：$0.25 輸出：$1.25 5 分鐘快取寫入：$0.30 1 小時快取寫入：$0.50 快取命中：$0.03	不適用
Claude 3.5 Haiku (已淘汰)	輸入：$0.80 美元輸出：$4 美元批次輸入：$0.40 美元批次輸出：$2 美元 5 分鐘快取寫入：$1 美元 1 小時快取寫入：$1.60 美元快取命中：$0.08 美元批次快取寫入：$0.50 美元批次快取命中：$0.04 美元	不適用
Claude 3.7 Sonnet (已淘汰)	輸入：$3 美元輸出：$15 美元批次輸入：$1.50 美元批次輸出：$7.50 美元快取寫入：$3.75 美元快取命中：$0.30 美元批次快取寫入：$1.875 美元批次快取命中：$0.15 美元	不適用

* 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元，則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。

工具定價

工具	費用
網頁搜尋要求	每 1,000 次搜尋$10 美元支援的模型：Claude Haiku 4.5、Claude Sonnet 4.5、Claude Sonnet 4、Claude Opus 4.1、Claude Opus 4 和 Claude Opus 4.6。

* 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元，則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。

Deepseek 的模型

型號	定價
DeepSeek-V3.1	輸入：每 100 萬個詞元 $0.60 美元輸出：每 100 萬個詞元 $1.70 美元快取命中：每 100 萬個詞元 $0.06 美元批次輸入：每 100 萬個詞元 $0.30 美元批次輸出：每 100 萬個詞元 $0.85 美元
DeepSeek-V3.2	輸入：每 100 萬個詞元 $0.56 美元輸出：每 100 萬個詞元 $1.68 美元快取命中：每 100 萬個詞元 $0.056 美元批次輸入：每 100 萬個詞元 $0.28 美元批次輸出：每 100 萬個詞元 $0.84 美元
DeepSeek-R1 (0528)	輸入：每 100 萬個詞元 $1.35 美元輸出：每 100 萬個詞元 $5.40 美元批次輸入：每 100 萬個詞元 $0.675 美元批次輸出：每 100 萬個詞元 $2.70 美元
DeepSeek-OCR	輸入：每 100 萬個詞元 $0.30 美元 (或每頁 $0.0003 美元) 輸出：每 100 萬個詞元 $1.20 美元 (或每頁 $0.00012 美元)

MiniMax 的模型

型號	定價
MiniMax-M2	輸入：每 100 萬個詞元 $0.30 美元輸出：每 100 萬個詞元 $1.20 美元快取命中：每 100 萬個詞元 $0.03 美元

Moonshot 的模型

型號	定價
Kimi-K2-Thinking	輸入：每 100 萬個詞元 $0.60 美元輸出：每 100 萬個詞元 $2.50 美元快取命中：每 100 萬個詞元 $0.06 美元

Qwen 的模型

型號	定價
Qwen3-Next-80B-Thinking	輸入：每 100 萬個詞元 $0.15 美元輸出：每 100 萬個詞元 $1.20 美元
Qwen3-Next-80B-Instruct	輸入：每 100 萬個詞元 $0.15 美元輸出：每 100 萬個詞元 $1.20 美元
Qwen3-Coder-480B-A35B-Instruct	輸入：每 100 萬個詞元 $0.22 美元輸出：每 100 萬個詞元 $1.80 美元快取命中：每 100 萬個詞元 $0.022 美元批次輸入：每 100 萬個詞元 $0.11 美元批次輸出：每 100 萬個詞元 $0.90 美元
Qwen3-235B-A22B-Instruct-2507	輸入：每 100 萬個詞元 $0.22 美元輸出：每 100 萬個詞元 $0.88 美元批次輸入：每 100 萬個詞元 $0.11 美元批次輸出：每 100 萬個詞元 $0.44 美元

GLM 的模型

型號	定價
GLM-4.7	輸入：每 100 萬個詞元 $0.60 美元輸出：每 100 萬個詞元 $2.20 美元
GLM-5 *	輸入：每 100 萬個詞元 $1 美元輸出：每 100 萬個詞元 $3.2 美元快取命中：每 100 萬個詞元 $0.1 美元

* 免費提供至 2026 年 2 月 19 日。

OpenAI 模型

型號	定價
gpt-oss-120b	輸入：每 100 萬個詞元 $0.09 美元輸出：每 100 萬個詞元 $0.36 美元批次輸入：每 100 萬個詞元 $0.045 美元批次輸出：每 100 萬個詞元 $0.18 美元
gpt-oss-20b	輸入：每 100 萬個詞元 $0.07 美元輸出：每 100 萬個詞元 $0.25 美元快取命中：每 100 萬個詞元 $0.007 美元批次輸入：每 100 萬個詞元 $0.035 美元批次輸出：每 100 萬個詞元 $0.125 美元

Meta 的 Llama 模型

型號	定價
Llama 3.1 405B	輸入：每 100 萬個詞元 $5.00 美元輸出：每 100 萬個詞元 $16.00 美元
Llama 3.3 70B	輸入：每 100 萬個詞元 $0.72 美元輸出：每 100 萬個詞元 $0.72 美元批次輸入：每 100 萬個詞元 $0.36 美元批次輸出：每 100 萬個詞元 $0.36 美元
Llama 4 Scout	輸入：每 100 萬個詞元 $0.25 美元輸出：每 100 萬個詞元 $0.70 美元批次輸入：每 100 萬個詞元 $0.125 美元批次輸出：每 100 萬個詞元 $0.35 美元
Llama 4 Maverick	輸入：每 100 萬個詞元 $0.35 美元輸出：每 100 萬個詞元 $1.15 美元批次輸入：每 100 萬個詞元 $0.175 美元批次輸出：每 100 萬個詞元 $0.575 美元

Mistral AI 的模型

型號	定價
Mistral OCR (25.05)	輸入：每 100 萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元) 輸出：每 100 萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元)
Mistral Medium 3	輸入：每 100 萬個詞元 $0.40 美元輸出：每 100 萬個詞元 $2.00 美元
Mistral Small 3.1 (25.03)	輸入：每 100 萬個詞元 $0.10 美元輸出：每 100 萬個詞元 $0.30 美元
Codestral 2	輸入：每 100 萬個詞元 $0.30 美元輸出：每 100 萬個詞元 $0.90 美元

索取客製化報價

Google Cloud 提供「即付即用」計費模式，您只需要為所用服務付費。貴機構如需索取客製化的報價，請與我們的銷售團隊聯絡。

聯絡銷售人員