在 Vertex AI 中建構及部署 AI 模型的費用
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,則會按照 Cloud Platform SKU 頁面列出的相應貨幣價格計費。
只有傳回 200 回應代碼的要求會產生費用。如果要求傳回其他回應代碼 (例如 4xx 和 5xx 代碼),則輸入或輸出內容不會產生費用。
本頁說明 Vertex AI 的生成式 AI 定價。如要瞭解其他 Vertex AI 服務 (包括 ML 平台和 MLOps 服務) 的定價,請參閱 Vertex AI 定價頁面。
Google 模型
Gemini 3
| 型號 | 類型 | 價格 (每 100 萬個詞元) <= 20 萬個輸入詞元 | 價格 (每 100 萬個詞元) > 20 萬個輸入詞元 | 價格 (每 100 萬個符記) <= 20 萬個已快取輸入符記 | 價格 (每 100 萬個權杖) > 20 萬個快取輸入權杖 | 價格 (每 100 萬個符元) <= 20 萬個輸入符元 (使用批次 API) | 價格 (每 100 萬個權杖) > 採用批次 API 的 20 萬個輸入權杖 |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro 預先發布版 | |||||||
| 輸入內容 (文字、圖片、影片、音訊) | $2 美元 | $4 美元 | $0.2 | $0.4 | $1 美元 | $2 美元 | |
| 文字輸出內容 (回覆和推理) | $12 美元 | $18 美元 | 不適用 | 不適用 | $6 美元 | $9 美元 | |
| 圖片輸出內容** | $120 | 不適用 | 不適用 | 不適用 | $60 | 不適用 | |
| 以 Google 搜尋建立基準,以及企業適用的網路內容建立基準 |
Gemini 3 Pro 方案每月提供 5,000 次搜尋查詢,不需額外付費。 超過這些上限的搜尋查詢,將以每 1,000 次搜尋查詢 $14 美元的費率計費。客戶向 Gemini 提交要求後,系統可能會向 Google 搜尋 (或 Web Grounding for Enterprise) 發出一個或多個查詢。系統會針對您執行的每項個別搜尋查詢收取費用。系統將於 2026 年 1 月 5 日開始計費。 使用 Google 搜尋或企業版網路基礎功能建立的輸入權杖不需付費。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||||||
| 利用 Google 地圖建立基準 |
Gemini 3 Pro 方案每月提供 5,000 次搜尋查詢,不另收費。 超出這些限制的 Maps 查詢,每 1,000 次查詢會收取 $14 美元。客戶向 Gemini 提交要求後,可能會產生一或多個 Google 地圖查詢。系統會針對您執行的每項查詢個別收費。2026 年 1 月 5 日開始收費 |
||||||
| 以您的資料建立基準 | 每 1,000 個要求 $2.5 美元。 | ||||||
* 如果查詢輸入內容的脈絡長度超過 20 萬個詞元,則所有詞元 (輸入和輸出) 都會以長脈絡費率計費。
** 1K (1024x1024) 和 2K (2048x2048) 輸出圖片會消耗 1, 120 個圖片輸出權杖,相當於每張圖片 $0.134 美元。4K (4096x4096) 圖片會消耗 2, 000 個圖片輸出權杖,相當於每張生成圖片 $0.24 美元。
Gemini 2.5
| 型號 | 類型 | 價格 (每 100 萬個詞元) <= 20 萬個輸入詞元 | 價格 (每 100 萬個詞元) > 20 萬個輸入詞元 | 價格 (每 100 萬個符記) <= 20 萬個已快取輸入符記 | 價格 (每 100 萬個權杖) > 20 萬個快取輸入權杖 | 價格 (每 100 萬個符元) <= 20 萬個輸入符元 (使用批次 API) | 價格 (每 100 萬個權杖) > 採用批次 API 的 20 萬個輸入權杖 |
|---|---|---|---|---|---|---|---|
| Gemini 2.5 Pro | |||||||
| 輸入內容 (文字、圖片、影片、音訊) | $1.25 美元 | $2.5 | $0.125 美元 | $0.250 美元 | $0.625 美元 | $1.25 美元 | |
| 文字輸出內容 (回覆和推理) | $10 美元 | $15 | 不適用 | 不適用 | $5 美元 | $7.5 | |
| Gemini 2.5 Pro 電腦使用 - 預先發布版 |
|||||||
| 輸入內容 (文字、圖片、影片、音訊) | $1.25 美元 | $2.5 | 不適用 | 不適用 | 不適用 | 不適用 | |
| 文字輸出內容 (回覆和推理) | $10.00 | $15.00 | 不適用 | 不適用 | 不適用 | 不適用 | |
Gemini 2.5 Flash |
|||||||
| 輸入內容 (文字、圖片、影片) | $0.30 美元 | $0.30 美元 | $0.030 美元 | $0.030 美元 | $0.15 美元 | $0.15 美元 | |
| 音訊輸入 | $1 美元 | $1 美元 | $0.100 | $0.100 | $0.5 | $0.5 | |
| 文字輸出內容 (回覆和推理) | $2.50 美元 | $2.50 美元 | 不適用 | 不適用 | $1.25 美元 | $1.25 美元 | |
| 圖片輸出*** | $30 美元 | $30 美元 | 不適用 | 不適用 | $15 | $15 | |
Gemini 2.5 Flash Live API |
|||||||
| 100 萬個輸入文字符記 | $0.5 | $0.5 | 不適用 | 不適用 | 不適用 | 不適用 | |
| 100 萬個輸入音訊詞元 | $3 美元 | $3 美元 | 不適用 | 不適用 | 不適用 | 不適用 | |
| 100 萬個輸入影片/圖片詞元 | $3 美元 | $3 美元 | 不適用 | 不適用 | 不適用 | 不適用 | |
| 100 萬個輸出文字詞元 | $2 美元 | $2 美元 | 不適用 | 不適用 | 不適用 | 不適用 | |
| 100 萬個輸出音訊詞元 | $12 美元 | $12 美元 | 不適用 | 不適用 | 不適用 | 不適用 | |
Gemini 2.5 Flash Lite |
|||||||
| 輸入內容 (文字、圖片、影片) | $0.1 美元 | $0.1 美元 | $0.010 美元 | $0.010 美元 | $0.05 美元 | $0.05 美元 | |
| 音訊輸入 | $0.3 美元 | $0.3 美元 | $0.030 美元 | $0.030 美元 | $0.15 美元 | $0.15 美元 | |
| 文字輸出內容 (回覆和推理) | $0.4 | $0.4 | 不適用 | 不適用 | $0.2 | $0.2 | |
以 Google 搜尋建立基準 |
Gemini 2.0 Flash、2.5 Flash 和 2.5 Flash-Lite 方案每天提供 1,500 個基礎提示,不另收費。Gemini 2.5 Pro 方案每天提供 10,000 個基礎提示,不需額外付費。 如超出上述限制,則每個 grounded 提示的費用為 $35 美元/1,000 個。 建立基準的提示是指提交給 Gemini 的要求,會對 Google 搜尋發出一個或多個查詢**。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||||||
以企業適用的網路內容建立基準 |
每 1,000 個已建立基準的提示$45 美元。基礎提示是指提交給 Gemini 的要求,會對 Web Grounding for enterprise 發出一個或多個查詢**。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||||||
| 以您的資料建立基準 | 每 1,000 個要求 $2.5 美元。 | ||||||
| 利用 Google 地圖建立基準 | 每 1,000 個基礎提示$25 美元。 一個錨定提示是指傳送給 Gemini 的要求,其中至少包含 1 個 Google 地圖查詢。 |
||||||
* 如果查詢輸入內容的脈絡長度超過 20 萬個詞元,則所有詞元 (輸入和輸出) 都會以長脈絡費率計費。
** 只有在提示成功傳回網路結果 (即結果包含至少一個來自網路的基準支援網址) 時,才會針對 Google 搜尋基準和企業版網路基準功能收費。Gemini 模型用量費用另計。
*** 1024x1024 圖片會消耗 1290 個符元。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元,請參閱我們的說明文件。
**** 電腦使用費計費會使用 Gemini 2.5 Pro SKU,以區分電腦使用費,並套用計費標記。詳情請參閱這篇文章。
- LiveAPI 工作階段背景資訊視窗計費說明:系統會針對工作階段背景資訊視窗中的所有權杖,按回合向您收費。工作階段脈絡視窗包含新權杖 (目前回合) + 前幾回合累積的所有權杖。也就是說,系統會重新處理過去輪次的權杖,並在每個新輪次中納入考量,直到達到您設定的脈絡視窗大小為止。「回合」是指使用者輸入內容和模型回覆。
- 主動式音訊模式:啟用後,LiveAPI 監聽時會收取輸入權杖費用。只有在 API 回應時,才會收取輸出權杖費用。
- 啟用音訊轉文字轉錄功能後,系統會按照文字權杖輸出費率,針對轉錄作業產生的所有文字權杖收費。
Gemini 2.0
Gemini 2.0 的計費方式是根據權杖數量。如要計算要求中的輸入詞元數量,再傳送要求,可以使用 SDK 分詞器或 countTokens API。 如果要求失敗並傳回 400 或 500 錯誤,系統不會向您收取 使用的權杖費用。
使用價目表中的切換鈕,比較根據權杖計費和根據模態計費的方案。
根據詞元計費
| 型號 | 類型 | 費用 | Batch API 定價 | ||
|---|---|---|---|---|---|
Gemini 2.0 Flash |
|||||
| 100 萬個輸入詞元 | $0.15 美元 | $0.075 美元 | |||
| 100 萬個輸入音訊詞元 | $1.00 美元 | $0.50 美元 | |||
| 100 萬個輸出文字詞元 | $0.60 美元 | $0.30 美元 | |||
| 微調 100 萬個訓練詞元 | $3.00 美元 | ||||
Gemini 2.0 Flash Image Generation |
|||||
| 100 萬個輸入詞元 | $0.15 美元 | ||||
| 100 萬個輸入音訊詞元 | $1.00 美元 | ||||
| 100 萬個輸入影片詞元 | $3 美元 | ||||
| 100 萬個輸出文字詞元 | $0.60 美元 | ||||
| 100 萬個輸出圖像詞元 | $30.00 | ||||
Gemini 2.0 Flash Live API |
|||||
| 100 萬個輸入文字符記 | $0.5 | ||||
| 100 萬個輸入音訊詞元 | $3 美元 | ||||
| 100 萬個輸入影片/圖片詞元 | $3 美元 | ||||
| 100 萬個輸出文字詞元 | $2 美元 | ||||
| 100 萬個輸出音訊詞元 | $12 美元 | ||||
Gemini 2.0 Flash Lite |
|||||
| 100 萬個輸入詞元 | $0.075 美元 | $0.0375 美元 | |||
| 100 萬個輸入音訊詞元 | $0.075 美元 | $0.0375 美元 | |||
| 100 萬個輸出文字詞元 | $0.30 美元 | $0.15 美元 | |||
| 微調 100 萬個訓練符元 | $1.00 美元 | ||||
以 Google 搜尋建立基準 |
Gemini 2.0 Flash 和 2.5 Flash 方案每天提供 1,500 個錨定提示,不需額外付費。 如果基礎提示超出這些限制,則會按 每 1,000 個基礎提示$35 美元計費。 以 Google 搜尋為基準的提示,是指提交給 Gemini 的要求,會對 Google 搜尋發出一個或多個查詢*。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||||
以企業適用的網路內容建立基準 |
每 1,000 個已建立基準的提示$45 美元。錨定提示是指提交給 Gemini 的要求,會向 Web Grounding for enterprise* 發出一個或多個查詢。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||||
| 以您的資料建立基準 | 2025 年 6 月 16 日起,每 1,000 個要求 $2.5 美元。 | ||||
運用 Google 地圖建立基準 |
Gemini 模型包含多項每日基礎提示,不需額外付費: 超出上述限制的基礎提示,將按 每 1,000 個基礎提示$25 美元計費。 一個基礎提示是指傳送給 Gemini 的要求,其中至少包含 1 個 Google 地圖查詢。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||||
根據模態計費
以下模態定價僅供參考,是根據平均應用實例計算而得。實際計費方式只會根據權杖數量:
- 4 個字元約等於 1 個文字權杖 (含空格)。
- 舉例來說,1024x1024 圖片會消耗 1290 個符元。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元,請參閱我們的說明文件。
- 在每秒一影格的取樣率下,影片輸入內容每秒會消耗 258 個權杖。含音訊的影片會同時產生影片和音訊權杖的費用。
- 沒有時間戳記的音訊輸入內容,每秒會消耗 25 個詞元。
| 型號 | 類型 | 費用 | Batch API 定價 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 輸入文字 (每 100 萬字元的費用) | $0.0375 美元 | $0.01875 | |
| 輸入圖片 (每張圖片的費用) | $0.0001935 | $0.00009675 | |
| 輸入影片 ($/秒) | $0.0000387 美元 | $0.00001935 | |
| 輸入音訊 ($/秒) | $0.000025 | $0.0000125 | |
| 輸出文字 (每 100 萬字元) | $0.15 美元 | $0.075 美元 | |
Gemini 2.0 Flash Image Generation |
|||
| 輸入文字 (每 100 萬字元的費用) | $0.0375 美元 | ||
| 輸入圖片 (每張圖片的費用) | $0.0001935 | ||
| 輸入影片 ($/秒) | $0.0000387 美元 | ||
| 輸入音訊 ($/秒) | $0.000025 | ||
| 輸出文字 (每 100 萬字元) | $0.15 美元 | ||
| 輸出圖片 ($/圖片) | $0.04 美元 | ||
Gemini 2.0 Flash Lite |
|||
| 輸入文字 (每 100 萬字元的費用) | $0.01875 | $0.009375 | |
| 輸入圖片 (每張圖片的費用) | $0.00009675 | $0.000048375 | |
| 輸入影片 ($/秒) | $0.00001935 | $0.000009675 | |
| 輸入音訊 ($/秒) | $0.000001875 | $0.000000938 | |
| 輸出文字 (每 100 萬字元) | $0.075 美元 | $0.0375 美元 | |
以 Google 搜尋建立基準 |
Gemini 2.0 Flash 和 2.5 Flash 方案每天提供 1,500 個錨定提示,不需額外付費。 如果基礎提示超出這些限制,則會按 每 1,000 個基礎提示$35 美元計費。 以 Google 搜尋為基準的提示,是指提交給 Gemini 的要求,會對 Google 搜尋發出一個或多個查詢*。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||
以企業適用的網路內容建立基準 |
每 1,000 個已建立基準的提示$45 美元。錨定提示是指提交給 Gemini 的要求,會向 Web Grounding for enterprise* 發出一個或多個查詢。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。
* PDF 會以圖像輸入計費,一個 PDF 頁面相當於一張圖像。
* 微調模型端點的預測價格與基礎模型相同。
* 只有在提示成功傳回網頁結果 (即結果包含至少一個來自網路的基準支援網址) 時,才會針對 Google 搜尋基準和企業版網頁基準計費。Gemini 模型用量費用另計。
* Gemini 2.0 Flash Live API:每秒音訊 (輸入/輸出) 25 個詞元、每秒影片 (輸入) 258 個詞元。Gemini 2.0 Flash Live API 仍為預先發布版,因此 Google 搜尋基準功能仍免費提供。
- LiveAPI 工作階段背景資訊視窗計費說明:系統會針對工作階段背景資訊視窗中的所有權杖,按回合向您收費。工作階段脈絡視窗包含新權杖 (目前回合) + 前幾回合累積的所有權杖。也就是說,系統會重新處理過去輪次的權杖,並在每個新輪次中納入考量,直到達到您設定的脈絡視窗大小為止。「回合」是指使用者輸入內容和模型回覆。
- 啟用音訊轉文字轉錄功能後,系統會按照文字權杖輸出費率,針對轉錄作業產生的所有文字權杖收費。
Vertex AI Model Optimizer 定價 (實驗性)*
Vertex AI Model Optimizer 提供單一中繼端點,可處理 Gemini 模型要求,讓企業客戶輕鬆使用 Gemini,不必指定要使用 Flash、Pro 或特定版本。他們只需設定偏好選項 (成本、品質或平衡),Model Optimizer 就會將每項查詢傳送至最適合的模型,並套用適當的智慧程度來完成工作。
Vertex AI Model Optimizer 採用動態定價。也就是說,每個符記的平均價格取決於完成工作時所套用的模型智慧等級。因此,我們在下方提供定價範例,說明根據設定可能發生的情況 (請參閱下表)。Model Optimizer SKU 是 $1 美元的 SKU,可做為計費的購買單位,使用模型後仍會依用量計費。
| I/O 比率為 5:1 | 範例 1 聊天機器人 |
注意:這些範圍並非保證,個別客戶的成效可能有所不同 | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 顧客偏好 | 傳送至 MO 的顧客輸入權杖 | 傳送至行銷目標的客戶輸出權杖 | 每百萬個權杖的平均輸入價格 (高範圍) | 每百萬個權杖的平均輸出價格 (高範圍) | 每百萬個權杖的平均輸入價格 (低範圍) | 每百萬個權杖的平均輸出價格 (低範圍) | |||||
| 費用 | 10,000,000 | 2,000,000 | $0.63 美元 | $2.50 美元 | $0.16 美元 | $0.63 美元 | |||||
| 平衡 | 10,000,000 | 2,000,000 | $1.26 美元 | $5.00 美元 | $0.63 美元 | $2.50 美元 | |||||
| 品質 | 10,000,000 | 2,000,000 | $1.89 | $7.50 | $1.26 美元 | $5.00 美元 | |||||
| I/O 比率 1:20 | 範例 2:生成內容 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 顧客偏好 | 傳送至 MO 的顧客輸入權杖 | 傳送至行銷目標的客戶輸出權杖 | 每百萬個權杖的平均輸入價格 (高範圍) | 每百萬個權杖的平均輸出價格 (高範圍) | 每百萬個權杖的平均輸入價格 (低範圍) | 每百萬個權杖的平均輸出價格 (低範圍) | |||||
| 費用 | 1,000,000 | 20,000,000 | $0.63 美元 | $2.50 美元 | $0.16 美元 | $0.63 美元 | |||||
| 平衡 | 1,000,000 | 20,000,000 | $1.26 美元 | $5.00 美元 | $0.63 美元 | $2.50 美元 | |||||
| 品質 | 1,000,000 | 20,000,000 | $1.89 | $7.50 | $1.26 美元 | $5.00 美元 | |||||
其他 Gemini 模型
Gemini 2.0 和 Gemini 2.5 以外的所有 Gemini 模型,都是根據字元、圖片、影片/音訊秒數等模態計費。文字輸入內容的計費方式為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回覆)。字元數是根據 UTF-8 碼位計算,且不含空格,因此每個符元約有 4 個字元。如果預測要求導致回應遭篩除,系統只會針對輸入內容收費。每個帳單週期結束時,系統會將未滿一美分 ($0.01) 的金額四捨五入至一美分。媒體 輸入內容的計費方式為每張圖片或每秒 (影片)。如果要求失敗並傳回 400 或 500 錯誤,系統不會向您收取使用的權杖費用。
| 型號 | 功能 | 類型 | 價格 ( =< 128K input tokens) |
價格 (輸入符元 > 128,000 個) |
||
|---|---|---|---|---|---|---|
| Gemini 1.5 Flash | 多模態 | 圖片輸入 影片輸入 文字輸入 音訊輸入 |
每張圖片 $0.00002 美元 每秒$0.00002 美元 每 1,000 個字元$0.00001875 美元 每秒$0.000002 美元 |
每張圖片 $0.00004 美元 每秒$0.00004 美元 每 1,000 個字元$0.0000375 美元 每秒$0.000004 美元 |
||
| 文字輸出 | 每 1,000 個字元 $0.000075 美元 | 每 1,000 個字元 $0.00015 | ||||
| 調整* | 訓練權杖 | 每 100 萬個詞元 $8 美元 | ||||
| Gemini 1.5 Pro | 多模態 | 圖片輸入 影片輸入 文字輸入 音訊輸入 |
每張圖片 $0.00032875 美元 每秒$0.00032875 美元 每 1,000 個字元$0.0003125 美元 每秒$0.00003125 美元 |
每張圖片 $0.0006575 美元 每秒$0.0006575 美元 每 1,000 個字元$0.000625 美元 每秒$0.0000625 美元 |
||
| 文字輸出 | 每 1,000 個字元 $0.00125 | 每 1,000 個字元 $0.0025 美元 | ||||
| 調整* | 訓練權杖 | 每 100 萬個詞元 $80 美元 | ||||
| Gemini 1.0 Pro | 多模態 | 圖片輸入 影片輸入 文字輸入 |
每張圖片 $0.0025 美元 每秒$0.002 美元 每 1,000 個字元$0.000125 美元 |
|||
| 文字輸出 | 每 1,000 個字元 $0.000375 美元 | |||||
| 以 Google 搜尋建立基準 | 文字 | 每 1,000 個基礎提示$35 美元。 以 Google 搜尋為基準的提示,是指提交給 Gemini 的要求,會對 Google 搜尋發出一個或多個查詢*。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||||
| 以企業適用的網路內容建立基準 | 文字 | 每 1,000 個已建立基準的提示$45 美元。 A grounded prompt is a request submitted to Gemini that makes one or more queries to Web Grounding for enterprise*. 即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。 如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。 |
||||
| 以您的資料建立基準 | 文字 | 2025 年 6 月 16 日起,每 1,000 項要求 $2.5 美元。 |
||||
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 如果查詢脈絡長度超過 128, 000 個詞元,所有詞元都會按長脈絡費率計費。
* Gemini 模型在批次模式中提供 50% 折扣。
* Gemini 1.0 Pro 僅支援最多 32,000 個詞元的脈絡窗口。
* PDF 會以圖像輸入計費,一個 PDF 頁面相當於一張圖像。
* 微調模型端點的預測價格與基礎模型相同。
* 只有在提示成功傳回網頁結果 (即結果包含至少一個來自網路的基準支援網址) 時,才會針對 Google 搜尋基準和企業版網頁基準功能收費。Gemini 模型用量費用另計。
Imagen
有了 Vertex AI 的 Imagen,您可以根據提供的文字提示生成全新圖像和編輯圖像,也可以使用定義的遮罩區域編輯圖像的特定部分,以及使用其他多項功能。
| 型號 | 功能 | 說明 | 輸入內容 | 輸出內容 | 價格 |
|---|---|---|---|---|---|
| Imagen 4 Ultra | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.06 美元 |
| Imagen 4 | 提高解析度 | 將生成圖片的解析度提高至 2K、3K 和 4K | 圖片 | 圖片 | 每張圖片 $0.06 美元 |
| Imagen 4 | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.04 美元 |
| Imagen 4 Fast | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.02 美元 |
| Imagen 3 | 圖像生成 | 生成圖片 編輯圖片 自訂圖片 |
文字提示 | 圖片 | 每張圖片 $0.04 美元 |
| Imagen 3 Fast | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.02 美元 |
| Imagen 2、Imagen 1 | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.020 美元 |
| Imagen 2、Imagen 1 | 圖像編輯 | 使用無遮罩或遮罩方法編輯圖片 | 圖像/文字提示 | 圖片 | 每張圖片 $0.020 美元 |
| Imagen 1 | 提高解析度 | 將生成圖片的解析度提高至 2K 和 4K | 圖片 | 圖片 | 每張圖片 $0.003 美元 |
| Imagen 1 | 微調 | 啟用使用者提供的「主體」,用於 Imagen 提示 (少量樣本訓練) | 主體附有文字識別碼,每個主體有 4 到 8 張圖片 | 微調模型 (使用使用者提供的科目訓練後) | 每節點時數價格 (Vertex AI 自訂訓練定價) |
| Imagen | 圖像說明生成 | 生成圖像的短篇或長篇說明文字 | 圖片 | 文字說明 | 每張圖片 $0.0015 美元 |
| Imagen | 圖像問題回答 | 根據參考圖片的問題提供答案 | 圖像/文字提示 | 文字答案 | 每張圖片 $0.0015 美元 |
| Imagen | Product Recontext | 在全新場景中重新構思產品 | 1-3 張相同產品的圖片,以及描述所需場景的文字提示 | 圖片 | 每張圖片 $0.12 美元 |
| Vertex 虛擬試穿 | 生成穿著不同服飾的人物圖像 | 1 張人物圖片和 1 張服飾圖片 | 圖片 | 每張圖片 $0.06 美元 |
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
Veo
Veo 能生成各種主題和風格的超高畫質影片,並更精準掌握真實物理效果、人類動作和表情的細微變化。
| 型號 | 功能 | 說明 | 輸入 | 輸出 | 輸出解析度 | 費用 |
|---|---|---|---|---|---|---|
| Veo 3.1 | 生成影片和音訊 | 根據文字提示或參考圖片,生成高品質影片,並同步加入語音/音效 | 文字/圖像提示 | 影片 + 音訊 | 720p、1080p | 每秒 $0.40 美元 |
| Veo 3.1 | 影片生成 | 根據文字提示或參考圖片生成高畫質影片 | 文字/圖像提示 | 影片 | 720p、1080p | 每秒 $0.20 美元 |
| Veo 3.1 Fast | 生成影片和音訊 | 根據文字提示或參考圖片,快速生成影片並同步加入語音/音效 | 文字/圖像提示 | 影片 + 音訊 | 720p、1080p | 每秒 $0.15 美元 |
| Veo 3.1 Fast | 影片生成 | 根據文字提示或參考圖片,更快生成影片 | 文字/圖像提示 | 影片 | 720p、1080p | 每秒 $0.10 美元 |
| Veo 3 | 生成影片和音訊 | 根據文字提示或參考圖片,生成高品質影片,並同步加入語音/音效 | 文字/圖像提示 | 影片 + 音訊 | 720p、1080p | 每秒 $0.40 美元 |
| Veo 3 | 影片生成 | 根據文字提示或參考圖片生成高畫質影片 | 文字/圖像提示 | 影片 | 720p、1080p | 每秒 $0.20 美元 |
| Veo 3 Fast | 生成影片和音訊 | 根據文字提示或參考圖片,快速生成影片並同步加入語音/音效 | 文字/圖像提示 | 影片 + 音訊 | 720p、1080p | 每秒 $0.15 美元 |
| Veo 3 Fast | 影片生成 | 根據文字提示或參考圖片,更快生成影片 | 文字/圖像提示 | 影片 | 720p、1080p | 每秒 $0.10 美元 |
| Veo 2 | 影片生成 | 根據文字提示或參考圖片生成影片 | 文字/圖像提示 | 影片 | 720p | 每秒 $0.50 美元 |
| Veo 2 | 進階控制項 | 透過開頭和結尾影格插補生成影片、延長生成影片,以及套用攝影機控制項 | 文字/圖片/影片提示 | 影片 | 720p | 每秒 $0.50 美元 |
Lyria
Lyria 2 可生成高品質的器樂音樂,非常適合用於精緻的作曲和細膩的創意探索,生成細微的輸出內容。
| 型號 | 功能 | 說明 | 輸入 | 輸出 | 費用 |
|---|---|---|---|---|---|
| Lyria 2 | 音樂生成 | 根據文字提示生成音樂 | 文字提示 | 音樂 | 每 30 秒 $0.06 美元 |
瞭解 AI 應用程式的嵌入費用
| 型號 | 類型 | 區域 | 每 1,000 個輸入權杖的價格 |
|---|---|---|---|
| Gemini Embedding | 輸入 | 全球 |
|
| 輸出 | 全球 |
|
| 型號 | 類型 | 區域 | 每 1,000 個字元的價格 |
|---|---|---|---|
| 文字嵌入 (不含 Gemini 嵌入) |
輸入 | 全球 |
|
| 輸出 | 全球 |
|
| 型號 | 功能 | 說明 | 輸入內容 | 輸出內容 | 價格 |
|---|---|---|---|---|---|
| multimodalembedding | 多模態嵌入:文字 | 使用文字做為輸入內容來生成嵌入 | 文字 | 嵌入 | 每輸入 1,000 個字元 $0.0002 |
| 多模態嵌入:圖像 | 使用圖片做為輸入內容,生成嵌入 | 圖片 | 嵌入 | 每張輸入圖片 $0.0001 美元 | |
| Embeddings for Multimodal: Video Plus | Video Plus | 影片 | 嵌入 (每分鐘影片最多 15 個嵌入) | 每秒影片 $0.0020 美元 | |
| Embeddings for Multimodal: Video Standard | Video Standard | 影片 | 嵌入 (每分鐘影片最多 8 個嵌入) | 每秒影片 $0.0010 美元 | |
| 多模態嵌入:影片基本概念 | 影片基本功能 | 影片 | 嵌入 (每分鐘影片最多 4 個嵌入) | 每秒影片 $0.0005 美元 |
| 開放原始碼模型 | 類型 | 每 1,000 個輸入權杖的價格 |
|---|---|---|
| multilingual-e5-small | 輸入內容: 輸出內容: 批次輸入內容: 批次輸出內容: |
線上要求:$0.000015 線上要求:免付費 批次要求:$0.0000075 批次要求:免付費 |
| multilingual-e5-large | 輸入內容: 輸出內容: 批次輸入內容: 批次輸出內容: |
線上要求:$0.000025 線上要求:免付費 批次要求:$0.0000125 批次要求:免付費 |
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
Vertex AI 程式碼完成功能的定價
Vertex AI 生成式 AI 的計費方式為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回覆)。字元數是根據 UTF-8 碼位計算,且不含空格。預先發布期間,費用可享 100% 折扣。如果預測要求導致回應遭篩選,系統只會針對輸入內容收費。每個帳單週期結束時,系統會將未滿一美分 ($0.01) 的金額四捨五入至一美分。
| 型號 | 類型 | 區域 | 每 1,000 個字元的價格 |
|---|---|---|---|
| Codey:完成程式碼 | 輸入 | 全球 |
|
| 輸出 | 全球 |
|
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
翻譯 (文字)
使用 Vertex AI API 和 Translation LLM 翻譯文字。LLM 翻譯的內容通常比傳統翻譯模型更流暢,聽起來更像人類說的話,但支援的語言較少(瞭解詳情)。
| 型號 | 方法 | 用量 | 每 100 萬個字元的價格 |
|---|---|---|---|
| LLM | 文字 翻譯* | 每月輸入字元數 |
每 100 萬個字元 $10 美元* |
| 每月輸出字元數 |
每 100 萬個字元 $10 美元* |
價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
*價格為模型處理的每個字元單價。如要進一步瞭解如何計算字元數,請參閱計費字元
明確快取脈絡快取儲存空間的價格
| 型號 | 功能 | 類型 | 價格 (每 100 萬個符記) <= 20 萬個輸入符記 |
價格 (每 100 萬個符元) > 20 萬個輸入符元 |
|---|---|---|---|---|
| Gemini 3 Pro | 脈絡快取儲存空間 | 輸入內容 (文字、圖片、影片、音訊) | 每小時每百萬個權杖 $4.5 美元 | 每小時每百萬個權杖 $4.5 美元 |
| Gemini 2.5 Pro | 脈絡快取儲存空間 | 輸入內容 (文字、圖片、影片、音訊) | 每小時每百萬個權杖 $4.5 美元 | 每小時每百萬個權杖 $4.5 美元 |
| Gemini 2.5 Flash | 脈絡快取儲存空間 | 輸入內容 (文字、圖片、影片、音訊) | $1 (每百萬權杖每小時) | $1 (每百萬權杖每小時) |
| Gemini 2.5 Flash Lite | 脈絡快取儲存空間 | 輸入內容 (文字、圖片、影片、音訊) | $1 (每百萬權杖每小時) | $1 (每百萬權杖每小時) |
Gemini 2.0 模型
根據詞元計費
模型 |
類型 |
儲存空間 (百萬權杖小時) |
費用 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 100 萬個輸入詞元 | $1.00 美元 | $0.0375 美元 | |
| 100 萬個輸入音訊詞元 | $1.00 美元 | $0.25 美元 | |
| 100 萬個輸出文字詞元 | 不適用 | 不適用 | |
Gemini 2.0 Flash Lite |
|||
| 100 萬個輸入詞元 | $1.00 美元 | $0.01875 | |
| 100 萬個輸入音訊詞元 | $1.00 美元 | $0.01875 | |
| 100 萬個輸出文字詞元 | 不適用 | 不適用 |
根據模態計費
以下模態定價僅供參考,是根據平均應用實例計算而得。實際計費方式只會根據權杖數量:
- 4 個字元約等於 1 個文字權杖 (含空格)。
- 舉例來說,1024x1024 圖片會消耗 1290 個符元。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元,請參閱我們的說明文件。
- 在每秒一影格的取樣率下,影片輸入內容每秒會消耗 258 個權杖。含音訊的影片會同時產生影片和音訊權杖的費用。
- 沒有時間戳記的音訊輸入內容,每秒會消耗 25 個詞元。
模型 |
類型 |
儲存空間 (模態-小時) |
價格 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 輸入文字 (每 100 萬字元的費用) | $0.25 美元 | $0.009375 | |
| 輸入圖片 (每張圖片的費用) | $0.00129 | $0.000048375 | |
| 輸入影片 ($/秒) | $0.000258 | $0.000009675 | |
| 輸入音訊 ($/秒) | $0.000025 | $0.00000625 | |
| 輸出文字 (每 100 萬字元) | 不適用 | 不適用 | |
Gemini 2.0 Flash Lite |
|||
| 輸入文字 (每 100 萬字元的費用) | $0.25 美元 | $0.0046875 | |
| 輸入圖片 (每張圖片的費用) | $0.00129 | $0.0000241875 | |
| 輸入影片 ($/秒) | $0.000258 | $0.000009675 | |
| 輸入音訊 ($/秒) | $0.000258 | $0.0000048375 | |
| 輸出文字 (每 100 萬字元) | 不適用 | 不適用 | |
以 Google 搜尋建立基準 |
Gemini 2.0 Flash 每天最多可處理 1,500 個基礎要求,不需額外付費。每日超過 1,500 次的 基礎要求,每 1,000 次要求將收取 $35 美元 (每日最多 100 萬次要求)。 如果每天需要超過 100 萬次要求,請與帳戶團隊聯絡。 |
||
以企業適用的網路內容建立基準 |
自 2025 年 5 月 5 日起,每 1,000 個要求 $45 美元 (每日最多 100 萬個要求)。 如果每天需要超過 100 萬次要求,請與帳戶團隊聯絡。 |
||
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* PDF 會以圖像輸入計費,一個 PDF 頁面相當於一張圖像。
* 微調模型端點的預測價格與基礎模型相同。
* 只有在要求傳回的結果包含至少一個來自網路的基礎支援網址時,才會針對 Google 搜尋基礎功能收費。此外,您也必須支付標準 Gemini 模型使用費。
佈建輸送量
佈建的處理量 可確保生成式 AI 需求獲得足夠的處理量,交易單位為 生成式 AI 擴充單元 (GSU)。 如要進一步瞭解各項 GSU 提供的輸送量,請按這裡 並使用我們的線上估算工具,請按這裡。
| 時間長度 | 每位 GSU 使用者價格 | 每 |
|---|---|---|
| 1 週承諾 | $1,200 | 週 |
| 綁約 1 個月 | $2,700 | 月 |
| 綁約 3 個月 | $2,400 | 月 |
| 1 年承諾使用合約 | $2,000 美元 | 月 |
費用計算範例
使用者需要確保 gemini-2.0-flash 能支援每秒 10 次查詢 (QPS),且每次查詢的輸入內容為 1,000 個文字權杖和 500 個音訊權杖,輸出內容為 300 個文字權杖。
根據 gemini-2.0-flash 的輸送量和消耗率表,我們知道輸入文字詞元的消耗率為 1 個詞元、輸入音訊詞元的消耗率為 7 個詞元,而輸出文字詞元的消耗率為 4 個詞元。
使用者的輸入詞元總數為 1,000* (每個輸入文字詞元 1 個詞元) + 500* (每個輸入音訊詞元 7 個詞元) = 4,500 個扣除額度調整後的輸入詞元。使用者的輸出詞元總數為 300* (每個輸出文字詞元 4 個詞元) = 1,200 個扣除調整後的輸出詞元。將兩者相加,得出 4,500 個經調整的輸入詞元 + 1,200 個經調整的輸出詞元 = 5,700 個查詢總詞元。
將每項查詢的總權杖數乘以 QPS,即可得出每秒總權杖數:5,700 個總權杖數/查詢 * 10 QPS = 57,000 個總權杖數/秒。
將這個數字除以每個 GSU 的每秒總輸送量,可得出 57,000 個每秒總權杖數 ÷ 每個 GSU 的每秒 3,360 個輸送量 = 16.96 個 GSU。這個模型的最低 GSU 購買增量為 1,因此使用者需要 17 個 GSU。
如果使用者想維持這個輸送量 1 週,費用將為 $1,200 美元 * 17 個 GSU = 每週 $20,400 美元。如果他們想維持這個輸送量 1 個月,費用將為 $2,700 * 17 個 GSU = 每月 $45,900 美元。如果他們想維持這個輸送量 3 個月,每月費用將為 $2,400 * 17 GSUs = $40,800。最後,如果他們想維持這個輸送量 1 年,每個月的費用將是 $2,000 * 17 GSUs = $34,000。
模型調整
模型調整是根據任務自訂大型模型的有效方法。這是提升模型品質和效率的關鍵步驟。模型微調有下列好處:
- 針對特定工作提供更高品質的輸出內容
- 提升模型穩健性
- 提示較短,因此推論延遲時間和成本較低
調整作業會按每百萬個訓練詞元計費。訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。在模型推論方面,Gemini 微調模型端點的預測價格與基礎模型相同。
| 型號 | 類型 | 價格 (每 100 萬個訓練權杖) |
|---|---|---|
| Gemini 2.5 Pro | 監督式微調 | $25 |
| Gemini 2.5 Flash | 監督式微調 偏好調整 |
$5 美元 |
| Gemini 2.5 Flash Lite | 監督式微調 偏好調整 |
$1.5 |
| Gemma 3 27B IT | 監督式微調 | $6.83 |
| Llama 3.1 8B | 監督式微調 | $0.67 |
| Llama 3.2 1B | 監督式微調 | $0.28 |
| Llama 3.2 3B | 監督式微調 | $0.61 |
| Llama 3.3 70B | 監督式微調 | $6.72 |
| Llama 4 Scout 17B 16E | 監督式微調 | $5.77 |
| Qwen 3 32B | 監督式微調 | $6.57 |
* 訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。
* Gemini 微調模型端點的預測價格與基礎模型相同。
比較 Vertex AI 合作夥伴模型的定價
合作夥伴模型是 Google 合作夥伴開發的精選生成式 AI 模型。合作夥伴模型以代管 API 形式提供。詳情請參閱合作夥伴模型總覽。 以下各節列出 Google 合作夥伴模型的定價詳細資料。
AI21 Labs 的模型
| 型號 | 定價 |
|---|---|
| Jamba 1.5 Large (已淘汰) | 輸入:每 100 萬個詞元 $2 美元 輸出:每 100 萬個詞元 $8 美元 |
| Jamba 1.5 Mini (已淘汰) | 輸入:每 100 萬個詞元 $0.20 美元 輸出:每 100 萬個詞元 $0.40 美元 |
Anthropic 的 Claude 模型
提供區域定價的機型
全球
| 型號 | 價格 (每 100 萬個符記) < 20 萬個輸入符記 | 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元 |
|---|---|---|
| Claude Opus 4.5 | 輸入:$5.00 輸出:$25.00 批次輸入:$2.50 批次輸出:$12.50 5 分鐘快取寫入:$6.25 1 小時快取寫入:$10.00 快取命中:$0.50 5 分鐘批次快取寫入:$3.125 1 小時批次快取寫入:$5.00 批次快取命中:$0.25 |
|
| Claude Sonnet 4.5 | 輸入:$3.00 美元 輸出:$15.00 美元 批次輸入:$1.50 美元 批次輸出:$7.50 美元 5 分鐘快取寫入:$3.75 美元 1 小時快取寫入:$6.00 美元 快取命中:$0.30 美元 批次快取寫入:$1.88 美元 批次快取命中:$0.15 美元 |
輸入:$6.00 美元 輸出:$22.50 美元 批次輸入:$3.00 美元 批次輸出:$11.25 美元 5 分鐘快取寫入:$7.50 美元 1 小時快取寫入:$12.00 美元 快取命中:$0.60 美元 批次快取寫入:$3.75 美元 批次快取命中:$0.30 美元 |
| Claude Haiku 4.5 | 輸入:$1.00 美元 輸出:$5.00 美元 批次輸入:$0.50 美元 批次輸出:$2.50 美元 5 分鐘快取寫入:$1.25 美元 1 小時快取寫入:$2.00 美元 快取命中:$0.10 美元 批次快取寫入:$0.625 美元 批次快取命中:$0.05 美元 |
us-east5
| 型號 | 價格 (每 100 萬個符記) < 20 萬個輸入符記 | 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元 |
|---|---|---|
| Claude Opus 4.5 | 輸入:$5.50 美元 輸出:$27.50 美元 批次輸入:$2.75 美元 批次輸出:$13.75 美元 5 分鐘快取寫入:$6.875 美元 1 小時快取寫入:$11.00 美元 快取命中:$0.55 美元 5 分鐘批次快取寫入:$3.438 美元 1 小時批次快取寫入:$5.50 美元 批次快取命中:$0.275 美元 |
|
| Claude Sonnet 4.5 | 輸入:$3.30 美元 輸出:$16.50 美元 批次輸入:$1.65 美元 批次輸出:$8.25 美元 5 分鐘快取寫入:$4.13 美元 1 小時快取寫入:$6.60 美元 快取命中:$0.33 美元 批次快取寫入:$2.06 美元 批次快取命中:$0.17 美元 |
輸入:$6.60 美元 輸出:$24.75 美元 批次輸入:$3.30 美元 批次輸出:$12.38 美元 5 分鐘快取寫入:$8.25 美元 1 小時快取寫入:$13.20 美元 快取命中:$0.66 美元 批次快取寫入:$4.13 美元 批次快取命中:$0.33 美元 |
| Claude Haiku 4.5 | 輸入:$1.10 美元 輸出:$5.50 美元 批次輸入:$0.55 美元 批次輸出:$2.75 美元 5 分鐘快取寫入:$1.375 美元 1 小時快取寫入:$2.20 美元 快取寫入:$1.375 美元 快取命中:$0.11 美元 批次快取寫入:$0.688 美元 批次快取命中:$0.055 美元 |
europe-west1
| 型號 | 價格 (每 100 萬個符記) < 20 萬個輸入符記 | 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元 |
|---|---|---|
| Claude Opus 4.5 | 輸入:$5.50 美元 輸出:$27.50 美元 批次輸入:$2.75 美元 批次輸出:$13.75 美元 5 分鐘快取寫入:$6.875 美元 1 小時快取寫入:$11.00 美元 快取命中:$0.55 美元 5 分鐘批次快取寫入:$3.438 美元 1 小時批次快取寫入:$5.50 美元 批次快取命中:$0.275 美元 |
|
| Claude Sonnet 4.5 | 輸入:$3.30 美元 輸出:$16.50 美元 批次輸入:$1.65 美元 批次輸出:$8.25 美元 5 分鐘快取寫入:$4.13 美元 1 小時快取寫入:$6.60 美元 快取命中:$0.33 美元 批次快取寫入:$2.06 美元 批次快取命中:$0.17 美元 |
輸入:$6.60 美元 輸出:$24.75 美元 批次輸入:$3.30 美元 批次輸出:$12.38 美元 5 分鐘快取寫入:$8.25 美元 1 小時快取寫入:$13.20 美元 快取命中:$0.66 美元 批次快取寫入:$4.13 美元 批次快取命中:$0.33 美元 |
| Claude Haiku 4.5 | 輸入:$1.10 美元 輸出:$5.50 美元 批次輸入:$0.55 美元 批次輸出:$2.75 美元 5 分鐘快取寫入:$1.375 美元 1 小時快取寫入:$2.20 美元 快取命中:$0.11 美元 批次快取寫入:$0.688 美元 批次快取命中:$0.055 美元 |
asia-southeast1
| 型號 | 價格 (每 100 萬個符記) < 20 萬個輸入符記 | 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元 |
|---|---|---|
| Claude Opus 4.5 | 輸入:$5.50 美元 輸出:$27.50 美元 批次輸入:$2.75 美元 批次輸出:$13.75 美元 5 分鐘快取寫入:$6.875 美元 1 小時快取寫入:$11.00 美元 快取命中:$0.55 美元 5 分鐘批次快取寫入:$3.438 美元 1 小時批次快取寫入:$5.50 美元 批次快取命中:$0.275 美元 |
|
| Claude Sonnet 4.5 | 輸入:$3.30 美元 輸出:$16.50 美元 批次輸入:$1.65 美元 批次輸出:$8.25 美元 5 分鐘快取寫入:$4.13 美元 1 小時快取寫入:$6.60 美元 快取命中:$0.33 美元 批次快取寫入:$2.06 美元 批次快取命中:$0.17 美元 |
輸入:$6.60 美元 輸出:$24.75 美元 批次輸入:$3.30 美元 批次輸出:$12.38 美元 5 分鐘快取寫入:$8.25 美元 1 小時快取寫入:$13.20 美元 快取命中:$0.66 美元 批次快取寫入:$4.13 美元 批次快取命中:$0.33 美元 |
asia-east1
| 型號 | 價格 (每 100 萬個符記) < 20 萬個輸入符記 | 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元 |
|---|---|---|
| Claude Haiku 4.5 | 輸入:$1.10 美元 輸出:$5.50 美元 批次輸入:$0.55 美元 批次輸出:$2.75 美元 5 分鐘快取寫入:$1.375 美元 1 小時快取寫入:$2.20 美元 快取寫入:$1.375 美元 快取命中:$0.11 美元 批次快取寫入:$0.688 美元 批次快取命中:$0.055 美元 |
* 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元,則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。
所有區域的價格都相同的模型
| 型號 | 價格 (每 100 萬個符記) < 20 萬個輸入符記 | 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元 |
|---|---|---|
| Claude Opus 4.1 | 輸入:$15 輸出:$75 批次輸入:$7.50 批次輸出:$37.50 5 分鐘快取寫入:$18.75 1 小時快取寫入:$30 快取命中:$1.50 批次快取寫入:$9.375 批次快取命中:$0.75 |
不適用 |
| Claude Opus 4 | 輸入:$15 輸出:$75 批次輸入:$7.50 批次輸出:$37.50 5 分鐘快取寫入:$18.75 1 小時快取寫入:$30 快取命中:$1.50 批次快取寫入:$9.375 批次快取命中:$0.75 |
不適用 |
| Claude Sonnet 4 | 輸入:$3 美元 輸出:$15 美元 批次輸入:$1.50 美元 批次輸出:$7.50 美元 5 分鐘快取寫入:$3.75 美元 1 小時快取寫入:$6.00 美元 快取命中:$0.30 美元 批次快取寫入:$1.875 美元 批次快取命中:$0.15 美元 |
輸入:$6 美元 輸出:$22.50 美元 批次輸入:$3 美元 批次輸出:$11.25 美元 5 分鐘快取寫入:$7.50 美元 1 小時快取寫入:$12.00 美元 快取命中:$0.60 美元 批次快取寫入:$3.75 美元 批次快取命中:$0.30 美元 |
| Claude 3.5 Haiku | 輸入:$0.80 輸出:$4 批次輸入:$0.40 批次輸出:$2 5 分鐘快取寫入:$1 1 小時快取寫入:$1.60 快取命中:$0.08 批次快取寫入:$0.50 批次快取命中:$0.04 |
不適用 |
| Claude 3 Haiku | 輸入:$0.25 輸出:$1.25 5 分鐘快取寫入:$0.30 1 小時快取寫入:$0.50 快取命中:$0.03 | 不適用 |
| Claude 3.7 Sonnet (已淘汰) | 輸入:$3 美元 輸出:$15 美元 批次輸入:$1.50 美元 批次輸出:$7.50 美元 快取寫入:$3.75 美元 快取命中:$0.30 美元 批次快取寫入:$1.875 美元 批次快取命中:$0.15 美元 |
不適用 |
| Claude 3.5 Sonnet v2 (已淘汰) | 輸入:$3 美元 輸出:$15 美元 批次輸入:$1.50 美元 批次輸出:$7.50 美元 快取寫入:$3.75 美元 快取命中:$0.30 美元 批次快取寫入:$1.875 美元 批次快取命中:$0.15 美元 |
不適用 |
| Claude 3.5 Sonnet (已淘汰) | 輸入:$3 輸出:$15 快取寫入:$3.75 快取命中:$0.30 |
不適用 |
| Claude 3 Opus (已淘汰) | 輸入:$15 輸出:$75 快取寫入:$18.75 快取命中:$1.50 |
不適用 |
* 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元,則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。
工具定價
| 工具 | 費用 |
|---|---|
| 網頁搜尋要求 | 每 1,000 次搜尋$10 美元
支援的模型:Claude Haiku 4.5、Claude Sonnet 4.5、Claude Sonnet 4、Claude Opus 4.1 和 Claude Opus 4。 |
* 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元,則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。
Deepseek 的模型
| 型號 | 定價 |
|---|---|
| DeepSeek-V3.1 | 輸入:每 100 萬個詞元 $0.60 美元 輸出:每 100 萬個詞元 $1.70 美元 批次輸入:每 100 萬個詞元 $0.30 美元 批次輸出:每 100 萬個詞元 $0.85 美元 |
| DeepSeek-V3.2 * | 輸入:每 100 萬個詞元 $0.56 美元 輸出:每 100 萬個詞元 $1.68 美元 批次輸入:每 100 萬個詞元 $0.28 美元 批次輸出:每 100 萬個詞元 $0.84 美元 |
| DeepSeek-R1 (0528) | 輸入:每 100 萬個詞元 $1.35 美元 輸出:每 100 萬個詞元 $5.40 美元 批次輸入:每 100 萬個詞元 $0.675 美元 批次輸出:每 100 萬個詞元 $2.70 美元 |
| DeepSeek-OCR | 輸入:每 100 萬個詞元 $0.30 美元 (或每頁 $0.0003 美元) 輸出:每 100 萬個詞元 $1.20 美元 (或每頁 $0.00012 美元) |
- 2025 年 12 月 17 日前免費。
MiniMax 的模型
| 型號 | 定價 |
|---|---|
| MiniMax-M2 | 輸入:每 100 萬個詞元 $0.30 美元 輸出:每 100 萬個詞元 $1.20 美元 |
Moonshot 的模型
| 型號 | 定價 |
|---|---|
| Kimi-K2-Thinking | 輸入:每 100 萬個詞元 $0.60 美元 輸出:每 100 萬個詞元 $2.50 美元 |
Qwen 的模型
| 型號 | 定價 |
|---|---|
| Qwen3-Next-80B-Thinking | 輸入:每 100 萬個詞元 $0.15 美元 輸出:每 100 萬個詞元 $1.20 美元 |
| Qwen3-Next-80B-Instruct | 輸入:每 100 萬個詞元 $0.15 美元 輸出:每 100 萬個詞元 $1.20 美元 |
| Qwen3-Coder-480B-A35B-Instruct | 輸入:每 100 萬個詞元 $0.22 美元 輸出:每 100 萬個詞元 $1.80 美元 批次輸入:每 100 萬個詞元 $0.11 美元 批次輸出:每 100 萬個詞元 $0.90 美元 |
| Qwen3-235B-A22B-Instruct-2507 | 輸入:每 100 萬個詞元 $0.22 美元 輸出:每 100 萬個詞元 $0.88 美元 批次輸入:每 100 萬個詞元 $0.11 美元 批次輸出:每 100 萬個詞元 $0.44 美元 |
OpenAI 模型
| 型號 | 定價 |
|---|---|
| gpt-oss-120b | 輸入:每 100 萬個詞元 $0.09 美元 輸出:每 100 萬個詞元 $0.36 美元 批次輸入:每 100 萬個詞元 $0.045 美元 批次輸出:每 100 萬個詞元 $0.18 美元 |
| gpt-oss-20b | 輸入:每 100 萬個詞元 $0.07 美元 輸出:每 100 萬個詞元 $0.25 美元 批次輸入:每 100 萬個詞元 $0.035 美元 批次輸出:每 100 萬個詞元 $0.125 美元 |
Meta 的 Llama 模型
| 型號 | 定價 |
|---|---|
| Llama 3.1 405B | 輸入:每 100 萬個詞元 $5.00 美元 輸出:每 100 萬個詞元 $16.00 美元 |
| Llama 3.3 70B | 輸入:每 100 萬個詞元 $0.72 美元 輸出:每 100 萬個詞元 $0.72 美元 批次輸入:每 100 萬個詞元 $0.36 美元 批次輸出:每 100 萬個詞元 $0.36 美元 |
| Llama 4 Scout | 輸入:每 100 萬個詞元 $0.25 美元 輸出:每 100 萬個詞元 $0.70 美元 批次輸入:每 100 萬個詞元 $0.125 美元 批次輸出:每 100 萬個詞元 $0.35 美元 |
| Llama 4 Maverick | 輸入:每 100 萬個詞元 $0.35 美元 輸出:每 100 萬個詞元 $1.15 美元 批次輸入:每 100 萬個詞元 $0.175 美元 批次輸出:每 100 萬個詞元 $0.575 美元 |
Mistral AI 的模型
| 型號 | 定價 |
|---|---|
| Mistral OCR (25.05) | 輸入:每 100 萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元) 輸出:每 100 萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元) |
| Mistral Medium 3 | 輸入:每 100 萬個詞元 $0.40 美元 輸出:每 100 萬個詞元 $2.00 美元 |
| Mistral Small 3.1 (25.03) | 輸入:每 100 萬個詞元 $0.10 美元 輸出:每 100 萬個詞元 $0.30 美元 |
| Mistral Large (24.11) (已淘汰) | 輸入:每 100 萬個詞元 $2.00 美元 輸出:每 100 萬個詞元 $6.00 美元 |
| Codestral 2 | 輸入:每百萬個詞元 $0.30 美元 輸出:每百萬個詞元 $0.90 美元 |
| Codestral (25.01) (已淘汰) | 輸入:每百萬個詞元 $0.30 美元 輸出:每百萬個詞元 $0.90 美元 |