在 Vertex AI 中建構及部署 AI 模型的費用

價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,則會按照 Cloud Platform SKU 頁面列出的相應貨幣價格計費。

只有傳回 200 回應代碼的要求會產生費用。如果要求傳回其他回應代碼 (例如 4xx 和 5xx 代碼),則輸入或輸出內容不會產生費用。

本頁說明 Vertex AI 的生成式 AI 定價。如要瞭解其他 Vertex AI 服務 (包括 ML 平台和 MLOps 服務) 的定價,請參閱 Vertex AI 定價頁面

Google 模型

Gemini 3

型號 類型 價格 (每 100 萬個詞元) <= 20 萬個輸入詞元 價格 (每 100 萬個詞元) > 20 萬個輸入詞元 價格 (每 100 萬個符記) <= 20 萬個已快取輸入符記 價格 (每 100 萬個權杖) > 20 萬個快取輸入權杖 價格 (每 100 萬個符元) <= 20 萬個輸入符元 (使用批次 API) 價格 (每 100 萬個權杖) > 採用批次 API 的 20 萬個輸入權杖
Gemini 3 Pro 預先發布版
輸入內容 (文字、圖片、影片、音訊) $2 美元 $4 美元 $0.2 $0.4 $1 美元 $2 美元
文字輸出內容 (回覆和推理) $12 美元 $18 美元 不適用 不適用 $6 美元 $9 美元
圖片輸出內容** $120 不適用 不適用 不適用 $60 不適用
以 Google 搜尋建立基準,以及企業適用的網路內容建立基準 Gemini 3 Pro 方案每月提供 5,000 次搜尋查詢,不需額外付費。

超過這些上限的搜尋查詢,將以每 1,000 次搜尋查詢 $14 美元的費率計費。客戶向 Gemini 提交要求後,系統可能會向 Google 搜尋 (或 Web Grounding for Enterprise) 發出一個或多個查詢。系統會針對您執行的每項個別搜尋查詢收取費用。系統將於 2026 年 1 月 5 日開始計費。

使用 Google 搜尋或企業版網路基礎功能建立的輸入權杖不需付費。

如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。
利用 Google 地圖建立基準 Gemini 3 Pro 方案每月提供 5,000 次搜尋查詢,不另收費。

超出這些限制的 Maps 查詢,每 1,000 次查詢會收取 $14 美元。客戶向 Gemini 提交要求後,可能會產生一或多個 Google 地圖查詢。系統會針對您執行的每項查詢個別收費。2026 年 1 月 5 日開始收費
以您的資料建立基準 每 1,000 個要求 $2.5 美元。

* 如果查詢輸入內容的脈絡長度超過 20 萬個詞元,則所有詞元 (輸入和輸出) 都會以長脈絡費率計費。
** 1K (1024x1024) 和 2K (2048x2048) 輸出圖片會消耗 1, 120 個圖片輸出權杖,相當於每張圖片 $0.134 美元。4K (4096x4096) 圖片會消耗 2, 000 個圖片輸出權杖,相當於每張生成圖片 $0.24 美元。

Gemini 2.5

型號 類型 價格 (每 100 萬個詞元) <= 20 萬個輸入詞元 價格 (每 100 萬個詞元) > 20 萬個輸入詞元 價格 (每 100 萬個符記) <= 20 萬個已快取輸入符記 價格 (每 100 萬個權杖) > 20 萬個快取輸入權杖 價格 (每 100 萬個符元) <= 20 萬個輸入符元 (使用批次 API) 價格 (每 100 萬個權杖) > 採用批次 API 的 20 萬個輸入權杖
Gemini 2.5 Pro
輸入內容 (文字、圖片、影片、音訊) $1.25 美元 $2.5 $0.125 美元 $0.250 美元 $0.625 美元 $1.25 美元
文字輸出內容 (回覆和推理) $10 美元 $15 不適用 不適用 $5 美元 $7.5
Gemini 2.5 Pro
電腦使用 - 預先發布版
輸入內容 (文字、圖片、影片、音訊) $1.25 美元 $2.5 不適用 不適用 不適用 不適用
文字輸出內容 (回覆和推理) $10.00 $15.00 不適用 不適用 不適用 不適用


Gemini 2.5
Flash
輸入內容 (文字、圖片、影片) $0.30 美元 $0.30 美元 $0.030 美元 $0.030 美元 $0.15 美元 $0.15 美元
音訊輸入 $1 美元 $1 美元 $0.100 $0.100 $0.5 $0.5
文字輸出內容 (回覆和推理) $2.50 美元 $2.50 美元 不適用 不適用 $1.25 美元 $1.25 美元
圖片輸出*** $30 美元 $30 美元 不適用 不適用 $15 $15




Gemini 2.5 Flash Live API
100 萬個輸入文字符記 $0.5 $0.5 不適用 不適用 不適用 不適用
100 萬個輸入音訊詞元 $3 美元 $3 美元 不適用 不適用 不適用 不適用
100 萬個輸入影片/圖片詞元 $3 美元 $3 美元 不適用 不適用 不適用 不適用
100 萬個輸出文字詞元 $2 美元 $2 美元 不適用 不適用 不適用 不適用
100 萬個輸出音訊詞元 $12 美元 $12 美元 不適用 不適用 不適用 不適用



Gemini 2.5 Flash Lite
輸入內容 (文字、圖片、影片) $0.1 美元 $0.1 美元 $0.010 美元 $0.010 美元 $0.05 美元 $0.05 美元
音訊輸入 $0.3 美元 $0.3 美元 $0.030 美元 $0.030 美元 $0.15 美元 $0.15 美元
文字輸出內容 (回覆和推理) $0.4 $0.4 不適用 不適用 $0.2 $0.2


以 Google 搜尋建立基準
Gemini 2.0 Flash2.5 Flash2.5 Flash-Lite 方案每天提供 1,500 個基礎提示,不另收費。Gemini 2.5 Pro 方案每天提供 10,000 個基礎提示,不需額外付費。

如超出上述限制,則每個 grounded 提示的費用為 $35 美元/1,000 個

建立基準的提示是指提交給 Gemini 的要求,會對 Google 搜尋發出一個或多個查詢&ast;&ast;。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。

如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。

以企業適用的網路內容建立基準
每 1,000 個已建立基準的提示$45 美元。基礎提示是指提交給 Gemini 的要求,會對 Web Grounding for enterprise 發出一個或多個查詢**。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。

如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。
以您的資料建立基準 每 1,000 個要求 $2.5 美元。
利用 Google 地圖建立基準 每 1,000 個基礎提示$25 美元

一個錨定提示是指傳送給 Gemini 的要求,其中至少包含 1 個 Google 地圖查詢。

* 如果查詢輸入內容的脈絡長度超過 20 萬個詞元,則所有詞元 (輸入和輸出) 都會以長脈絡費率計費。
** 只有在提示成功傳回網路結果 (即結果包含至少一個來自網路的基準支援網址) 時,才會針對 Google 搜尋基準和企業版網路基準功能收費。Gemini 模型用量費用另計。
*** 1024x1024 圖片會消耗 1290 個符元。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元,請參閱我們的說明文件
**** 電腦使用費計費會使用 Gemini 2.5 Pro SKU,以區分電腦使用費,並套用計費標記。詳情請參閱這篇文章

  • LiveAPI 工作階段背景資訊視窗計費說明:系統會針對工作階段背景資訊視窗中的所有權杖,按回合向您收費。工作階段脈絡視窗包含新權杖 (目前回合) + 前幾回合累積的所有權杖。也就是說,系統會重新處理過去輪次的權杖,並在每個新輪次中納入考量,直到達到您設定的脈絡視窗大小為止。「回合」是指使用者輸入內容和模型回覆。
  • 主動式音訊模式:啟用後,LiveAPI 監聽時會收取輸入權杖費用。只有在 API 回應時,才會收取輸出權杖費用。
  • 啟用音訊轉文字轉錄功能後,系統會按照文字權杖輸出費率,針對轉錄作業產生的所有文字權杖收費。

Gemini 2.0

Gemini 2.0 的計費方式是根據權杖數量。如要計算要求中的輸入詞元數量,再傳送要求,可以使用 SDK 分詞器countTokens API。 如果要求失敗並傳回 400 或 500 錯誤,系統不會向您收取 使用的權杖費用。

使用價目表中的切換鈕,比較根據權杖計費和根據模態計費的方案。

根據詞元計費

型號 類型 費用 Batch API 定價




Gemini 2.0 Flash
100 萬個輸入詞元 $0.15 美元 $0.075 美元
100 萬個輸入音訊詞元 $1.00 美元 $0.50 美元
100 萬個輸出文字詞元 $0.60 美元 $0.30 美元
微調 100 萬個訓練詞元 $3.00 美元




Gemini 2.0 Flash Image Generation
100 萬個輸入詞元 $0.15 美元
100 萬個輸入音訊詞元 $1.00 美元
100 萬個輸入影片詞元 $3 美元
100 萬個輸出文字詞元 $0.60 美元
100 萬個輸出圖像詞元 $30.00




Gemini 2.0 Flash Live API
100 萬個輸入文字符記 $0.5
100 萬個輸入音訊詞元 $3 美元
100 萬個輸入影片/圖片詞元 $3 美元
100 萬個輸出文字詞元 $2 美元
100 萬個輸出音訊詞元 $12 美元




Gemini 2.0 Flash Lite
100 萬個輸入詞元 $0.075 美元 $0.0375 美元
100 萬個輸入音訊詞元 $0.075 美元 $0.0375 美元
100 萬個輸出文字詞元 $0.30 美元 $0.15 美元
微調 100 萬個訓練符元 $1.00 美元


以 Google 搜尋建立基準
Gemini 2.0 Flash2.5 Flash 方案每天提供 1,500 個錨定提示,不需額外付費。

如果基礎提示超出這些限制,則會按 每 1,000 個基礎提示$35 美元計費。

以 Google 搜尋為基準的提示,是指提交給 Gemini 的要求,會對 Google 搜尋發出一個或多個查詢*。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。

如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。

以企業適用的網路內容建立基準
每 1,000 個已建立基準的提示$45 美元。錨定提示是指提交給 Gemini 的要求,會向 Web Grounding for enterprise* 發出一個或多個查詢。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。

如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。
以您的資料建立基準 2025 年 6 月 16 日起,每 1,000 個要求 $2.5 美元。


運用 Google 地圖建立基準
Gemini 模型包含多項每日基礎提示,不需額外付費:
  • Gemini FlashFlash-Lite:每日共 1,500 個錨定提示。
  • Gemini Pro:每天 10,000 個基礎提示。

  • 超出上述限制的基礎提示,將按 每 1,000 個基礎提示$25 美元計費。

    一個基礎提示是指傳送給 Gemini 的要求,其中至少包含 1 個 Google 地圖查詢。

    如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。

    根據模態計費

    以下模態定價僅供參考,是根據平均應用實例計算而得。實際計費方式只會根據權杖數量:

    • 4 個字元約等於 1 個文字權杖 (含空格)。
    • 舉例來說,1024x1024 圖片會消耗 1290 個符元。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元,請參閱我們的說明文件
    • 在每秒一影格的取樣率下,影片輸入內容每秒會消耗 258 個權杖。含音訊的影片會同時產生影片和音訊權杖的費用。
    • 沒有時間戳記的音訊輸入內容,每秒會消耗 25 個詞元。
    型號 類型 費用 Batch API 定價




    Gemini 2.0 Flash
    輸入文字 (每 100 萬字元的費用) $0.0375 美元 $0.01875
    輸入圖片 (每張圖片的費用) $0.0001935 $0.00009675
    輸入影片 ($/秒) $0.0000387 美元 $0.00001935
    輸入音訊 ($/秒) $0.000025 $0.0000125
    輸出文字 (每 100 萬字元) $0.15 美元 $0.075 美元




    Gemini 2.0 Flash Image Generation
    輸入文字 (每 100 萬字元的費用) $0.0375 美元
    輸入圖片 (每張圖片的費用) $0.0001935
    輸入影片 ($/秒) $0.0000387 美元
    輸入音訊 ($/秒) $0.000025
    輸出文字 (每 100 萬字元) $0.15 美元
    輸出圖片 ($/圖片) $0.04 美元





    Gemini 2.0 Flash Lite
    輸入文字 (每 100 萬字元的費用) $0.01875 $0.009375
    輸入圖片 (每張圖片的費用) $0.00009675 $0.000048375
    輸入影片 ($/秒) $0.00001935 $0.000009675
    輸入音訊 ($/秒) $0.000001875 $0.000000938
    輸出文字 (每 100 萬字元) $0.075 美元 $0.0375 美元


    以 Google 搜尋建立基準
    Gemini 2.0 Flash2.5 Flash 方案每天提供 1,500 個錨定提示,不需額外付費。

    如果基礎提示超出這些限制,則會按 每 1,000 個基礎提示$35 美元計費。

    以 Google 搜尋為基準的提示,是指提交給 Gemini 的要求,會對 Google 搜尋發出一個或多個查詢*。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。

    如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。

    以企業適用的網路內容建立基準
    每 1,000 個已建立基準的提示$45 美元。錨定提示是指提交給 Gemini 的要求,會向 Web Grounding for enterprise* 發出一個或多個查詢。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。

    如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。

    * 價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
    * 訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。
    * PDF 會以圖像輸入計費,一個 PDF 頁面相當於一張圖像。
    * 微調模型端點的預測價格與基礎模型相同。
    * 只有在提示成功傳回網頁結果 (即結果包含至少一個來自網路的基準支援網址) 時,才會針對 Google 搜尋基準和企業版網頁基準計費。Gemini 模型用量費用另計。
    * Gemini 2.0 Flash Live API:每秒音訊 (輸入/輸出) 25 個詞元、每秒影片 (輸入) 258 個詞元。Gemini 2.0 Flash Live API 仍為預先發布版,因此 Google 搜尋基準功能仍免費提供。

    • LiveAPI 工作階段背景資訊視窗計費說明:系統會針對工作階段背景資訊視窗中的所有權杖,按回合向您收費。工作階段脈絡視窗包含新權杖 (目前回合) + 前幾回合累積的所有權杖。也就是說,系統會重新處理過去輪次的權杖,並在每個新輪次中納入考量,直到達到您設定的脈絡視窗大小為止。「回合」是指使用者輸入內容和模型回覆。
    • 啟用音訊轉文字轉錄功能後,系統會按照文字權杖輸出費率,針對轉錄作業產生的所有文字權杖收費。

    Vertex AI Model Optimizer 定價 (實驗性)*

    Vertex AI Model Optimizer 提供單一中繼端點,可處理 Gemini 模型要求,讓企業客戶輕鬆使用 Gemini,不必指定要使用 Flash、Pro 或特定版本。他們只需設定偏好選項 (成本、品質或平衡),Model Optimizer 就會將每項查詢傳送至最適合的模型,並套用適當的智慧程度來完成工作。

    Vertex AI Model Optimizer 採用動態定價。也就是說,每個符記的平均價格取決於完成工作時所套用的模型智慧等級。因此,我們在下方提供定價範例,說明根據設定可能發生的情況 (請參閱下表)。Model Optimizer SKU 是 $1 美元的 SKU,可做為計費的購買單位,使用模型後仍會依用量計費。

    I/O 比率為 5:1 範例 1
    聊天機器人
    注意:這些範圍並非保證,個別客戶的成效可能有所不同
    顧客偏好 傳送至 MO 的顧客輸入權杖 傳送至行銷目標的客戶輸出權杖 每百萬個權杖的平均輸入價格 (高範圍) 每百萬個權杖的平均輸出價格 (高範圍) 每百萬個權杖的平均輸入價格 (低範圍) 每百萬個權杖的平均輸出價格 (低範圍)
    費用 10,000,000 2,000,000 $0.63 美元 $2.50 美元 $0.16 美元 $0.63 美元
    平衡 10,000,000 2,000,000 $1.26 美元 $5.00 美元 $0.63 美元 $2.50 美元
    品質 10,000,000 2,000,000 $1.89 $7.50 $1.26 美元 $5.00 美元
    I/O 比率 1:20 範例 2:生成內容
    顧客偏好 傳送至 MO 的顧客輸入權杖 傳送至行銷目標的客戶輸出權杖 每百萬個權杖的平均輸入價格 (高範圍) 每百萬個權杖的平均輸出價格 (高範圍) 每百萬個權杖的平均輸入價格 (低範圍) 每百萬個權杖的平均輸出價格 (低範圍)
    費用 1,000,000 20,000,000 $0.63 美元 $2.50 美元 $0.16 美元 $0.63 美元
    平衡 1,000,000 20,000,000 $1.26 美元 $5.00 美元 $0.63 美元 $2.50 美元
    品質 1,000,000 20,000,000 $1.89 $7.50 $1.26 美元 $5.00 美元

    * Model Optimizer 是付費實驗性產品,可能會將要求轉送至 Vertex 上的 Gemini 實驗版本。

    其他 Gemini 模型

    Gemini 2.0 和 Gemini 2.5 以外的所有 Gemini 模型,都是根據字元、圖片、影片/音訊秒數等模態計費。文字輸入內容的計費方式為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回覆)。字元數是根據 UTF-8 碼位計算,且不含空格,因此每個符元約有 4 個字元。如果預測要求導致回應遭篩除,系統只會針對輸入內容收費。每個帳單週期結束時,系統會將未滿一美分 ($0.01) 的金額四捨五入至一美分。媒體 輸入內容的計費方式為每張圖片或每秒 (影片)。如果要求失敗並傳回 400 或 500 錯誤,系統不會向您收取使用的權杖費用。

    型號 功能 類型 價格
    ( =< 128K input tokens)
    價格
    (輸入符元 > 128,000 個)
    Gemini 1.5 Flash 多模態 圖片輸入
    影片輸入
    文字輸入
    音訊輸入
    每張圖片 $0.00002 美元
    每秒$0.00002 美元
    每 1,000 個字元$0.00001875 美元
    每秒$0.000002 美元
    每張圖片 $0.00004 美元
    每秒$0.00004 美元
    每 1,000 個字元$0.0000375 美元
    每秒$0.000004 美元
    文字輸出 每 1,000 個字元 $0.000075 美元 每 1,000 個字元 $0.00015
    調整* 訓練權杖 每 100 萬個詞元 $8 美元
    Gemini 1.5 Pro 多模態 圖片輸入
    影片輸入
    文字輸入
    音訊輸入
    每張圖片 $0.00032875 美元
    每秒$0.00032875 美元
    每 1,000 個字元$0.0003125 美元
    每秒$0.00003125 美元
    每張圖片 $0.0006575 美元
    每秒$0.0006575 美元
    每 1,000 個字元$0.000625 美元
    每秒$0.0000625 美元
    文字輸出 每 1,000 個字元 $0.00125 每 1,000 個字元 $0.0025 美元
    調整* 訓練權杖 每 100 萬個詞元 $80 美元
    Gemini 1.0 Pro 多模態 圖片輸入
    影片輸入
    文字輸入
    每張圖片 $0.0025 美元
    每秒$0.002 美元
    每 1,000 個字元$0.000125 美元
    文字輸出 每 1,000 個字元 $0.000375 美元
    以 Google 搜尋建立基準 文字 每 1,000 個基礎提示$35 美元

    以 Google 搜尋為基準的提示,是指提交給 Gemini 的要求,會對 Google 搜尋發出一個或多個查詢*。即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。

    如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。
    以企業適用的網路內容建立基準 文字 每 1,000 個已建立基準的提示$45 美元

    A grounded prompt is a request submitted to Gemini that makes one or more queries to Web Grounding for enterprise*. 即使向 Google 搜尋傳送多個搜尋查詢,也只會針對錨定提示收取一次費用。

    如果每天需要超過 100 萬個基礎提示,請與帳戶團隊聯絡。
    以您的資料建立基準 文字 2025 年 6 月 16 日起,每 1,000 項要求 $2.5 美元。

    * 價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
    * 如果查詢脈絡長度超過 128, 000 個詞元,所有詞元都會按長脈絡費率計費。
    * Gemini 模型在批次模式中提供 50% 折扣。
    * Gemini 1.0 Pro 僅支援最多 32,000 個詞元的脈絡窗口。
    * PDF 會以圖像輸入計費,一個 PDF 頁面相當於一張圖像。
    * 微調模型端點的預測價格與基礎模型相同。
    * 只有在提示成功傳回網頁結果 (即結果包含至少一個來自網路的基準支援網址) 時,才會針對 Google 搜尋基準和企業版網頁基準功能收費。Gemini 模型用量費用另計。

    Imagen

    有了 Vertex AI 的 Imagen,您可以根據提供的文字提示生成全新圖像和編輯圖像,也可以使用定義的遮罩區域編輯圖像的特定部分,以及使用其他多項功能。

    型號 功能 說明 輸入內容 輸出內容 價格
    Imagen 4 Ultra 圖像生成 生成圖片 文字提示 圖片 每張圖片 $0.06 美元
    Imagen 4 提高解析度 將生成圖片的解析度提高至 2K、3K 和 4K 圖片 圖片 每張圖片 $0.06 美元
    Imagen 4 圖像生成 生成圖片 文字提示 圖片 每張圖片 $0.04 美元
    Imagen 4 Fast 圖像生成 生成圖片 文字提示 圖片 每張圖片 $0.02 美元
    Imagen 3 圖像生成 生成圖片
    編輯圖片
    自訂圖片
    文字提示 圖片 每張圖片 $0.04 美元
    Imagen 3 Fast 圖像生成 生成圖片 文字提示 圖片 每張圖片 $0.02 美元
    Imagen 2、Imagen 1 圖像生成 生成圖片 文字提示 圖片 每張圖片 $0.020 美元
    Imagen 2、Imagen 1 圖像編輯 使用無遮罩或遮罩方法編輯圖片 圖像/文字提示 圖片 每張圖片 $0.020 美元
    Imagen 1 提高解析度 將生成圖片的解析度提高至 2K 和 4K 圖片 圖片 每張圖片 $0.003 美元
    Imagen 1 微調 啟用使用者提供的「主體」,用於 Imagen 提示 (少量樣本訓練) 主體附有文字識別碼,每個主體有 4 到 8 張圖片 微調模型 (使用使用者提供的科目訓練後) 每節點時數價格 (Vertex AI 自訂訓練定價)
    Imagen 圖像說明生成 生成圖像的短篇或長篇說明文字 圖片 文字說明 每張圖片 $0.0015 美元
    Imagen 圖像問題回答 根據參考圖片的問題提供答案 圖像/文字提示 文字答案 每張圖片 $0.0015 美元
    Imagen Product Recontext 在全新場景中重新構思產品 1-3 張相同產品的圖片,以及描述所需場景的文字提示 圖片 每張圖片 $0.12 美元
    Vertex 虛擬試穿 生成穿著不同服飾的人物圖像 1 張人物圖片和 1 張服飾圖片 圖片 每張圖片 $0.06 美元

    價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

    Veo

    Veo 能生成各種主題和風格的超高畫質影片,並更精準掌握真實物理效果、人類動作和表情的細微變化。

    型號 功能 說明 輸入 輸出 輸出解析度 費用
    Veo 3.1 生成影片和音訊 根據文字提示或參考圖片,生成高品質影片,並同步加入語音/音效 文字/圖像提示 影片 + 音訊 720p、1080p 每秒 $0.40 美元
    Veo 3.1 影片生成 根據文字提示或參考圖片生成高畫質影片 文字/圖像提示 影片 720p、1080p 每秒 $0.20 美元
    Veo 3.1 Fast 生成影片和音訊 根據文字提示或參考圖片,快速生成影片並同步加入語音/音效 文字/圖像提示 影片 + 音訊 720p、1080p 每秒 $0.15 美元
    Veo 3.1 Fast 影片生成 根據文字提示或參考圖片,更快生成影片 文字/圖像提示 影片 720p、1080p 每秒 $0.10 美元
    Veo 3 生成影片和音訊 根據文字提示或參考圖片,生成高品質影片,並同步加入語音/音效 文字/圖像提示 影片 + 音訊 720p、1080p 每秒 $0.40 美元
    Veo 3 影片生成 根據文字提示或參考圖片生成高畫質影片 文字/圖像提示 影片 720p、1080p 每秒 $0.20 美元
    Veo 3 Fast 生成影片和音訊 根據文字提示或參考圖片,快速生成影片並同步加入語音/音效 文字/圖像提示 影片 + 音訊 720p、1080p 每秒 $0.15 美元
    Veo 3 Fast 影片生成 根據文字提示或參考圖片,更快生成影片 文字/圖像提示 影片 720p、1080p 每秒 $0.10 美元
    Veo 2 影片生成 根據文字提示或參考圖片生成影片 文字/圖像提示 影片 720p 每秒 $0.50 美元
    Veo 2 進階控制項 透過開頭和結尾影格插補生成影片、延長生成影片,以及套用攝影機控制項 文字/圖片/影片提示 影片 720p 每秒 $0.50 美元

    Lyria

    Lyria 2 可生成高品質的器樂音樂,非常適合用於精緻的作曲和細膩的創意探索,生成細微的輸出內容。

    型號 功能 說明 輸入 輸出 費用
    Lyria 2 音樂生成 根據文字提示生成音樂 文字提示 音樂 每 30 秒 $0.06 美元

    瞭解 AI 應用程式的嵌入費用

    型號 類型 區域 每 1,000 個輸入權杖的價格
    Gemini Embedding 輸入 全球
    • 線上要求:$0.00015
    • 批次要求:$0.00012
    輸出 全球
    • 線上申請:免費
    • 批次要求:免付費
    型號 類型 區域 每 1,000 個字元的價格
    文字嵌入
    (不含 Gemini 嵌入)
    輸入 全球
    • 線上要求:$0.000025
    • 批次要求:$0.00002
    輸出 全球
    • 線上申請:免費
    • 批次要求:免付費
    型號 功能 說明 輸入內容 輸出內容 價格
    multimodalembedding 多模態嵌入:文字 使用文字做為輸入內容來生成嵌入 文字 嵌入 每輸入 1,000 個字元 $0.0002
    多模態嵌入:圖像 使用圖片做為輸入內容,生成嵌入 圖片 嵌入 每張輸入圖片 $0.0001 美元
    Embeddings for Multimodal: Video Plus Video Plus 影片 嵌入 (每分鐘影片最多 15 個嵌入) 每秒影片 $0.0020 美元
    Embeddings for Multimodal: Video Standard Video Standard 影片 嵌入 (每分鐘影片最多 8 個嵌入) 每秒影片 $0.0010 美元
    多模態嵌入:影片基本概念 影片基本功能 影片 嵌入 (每分鐘影片最多 4 個嵌入) 每秒影片 $0.0005 美元
    開放原始碼模型 類型 每 1,000 個輸入權杖的價格
    multilingual-e5-small 輸入內容:
    輸出內容:

    批次輸入內容:
    批次輸出內容:
    線上要求:$0.000015
    線上要求:免付費

    批次要求:$0.0000075
    批次要求:免付費
    multilingual-e5-large 輸入內容:
    輸出內容:

    批次輸入內容:
    批次輸出內容:
    線上要求:$0.000025
    線上要求:免付費

    批次要求:$0.0000125
    批次要求:免付費

    價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

    Vertex AI 程式碼完成功能的定價

    Vertex AI 生成式 AI 的計費方式為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回覆)。字元數是根據 UTF-8 碼位計算,且不含空格。預先發布期間,費用可享 100% 折扣。如果預測要求導致回應遭篩選,系統只會針對輸入內容收費。每個帳單週期結束時,系統會將未滿一美分 ($0.01) 的金額四捨五入至一美分。

    型號 類型 區域 每 1,000 個字元的價格
    Codey:完成程式碼 輸入 全球
    • 線上要求:$0.00025
    輸出 全球
    • 線上要求:$0.0005

    價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

    翻譯 (文字)

    使用 Vertex AI API 和 Translation LLM 翻譯文字。LLM 翻譯的內容通常比傳統翻譯模型更流暢,聽起來更像人類說的話,但支援的語言較少(瞭解詳情)

    型號 方法 用量 每 100 萬個字元的價格
    LLM 文字 翻譯* 每月輸入字元數

    每 100 萬個字元 $10 美元*

    每月輸出字元數

    每 100 萬個字元 $10 美元*

    價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
    *價格為模型處理的每個字元單價。如要進一步瞭解如何計算字元數,請參閱計費字元

    明確快取脈絡快取儲存空間的價格

    型號 功能 類型 價格 (每 100 萬個符記)
    <= 20 萬個輸入符記
    價格 (每 100 萬個符元)
    > 20 萬個輸入符元
    Gemini 3 Pro 脈絡快取儲存空間 輸入內容 (文字、圖片、影片、音訊) 每小時每百萬個權杖 $4.5 美元 每小時每百萬個權杖 $4.5 美元
    Gemini 2.5 Pro 脈絡快取儲存空間 輸入內容 (文字、圖片、影片、音訊) 每小時每百萬個權杖 $4.5 美元 每小時每百萬個權杖 $4.5 美元
    Gemini 2.5 Flash 脈絡快取儲存空間 輸入內容 (文字、圖片、影片、音訊) $1 (每百萬權杖每小時) $1 (每百萬權杖每小時)
    Gemini 2.5 Flash Lite 脈絡快取儲存空間 輸入內容 (文字、圖片、影片、音訊) $1 (每百萬權杖每小時) $1 (每百萬權杖每小時)

    Gemini 2.0 模型

    根據詞元計費


    模型

    類型
    儲存空間
    (百萬權杖小時)
    費用




    Gemini 2.0 Flash
    100 萬個輸入詞元 $1.00 美元 $0.0375 美元
    100 萬個輸入音訊詞元 $1.00 美元 $0.25 美元
    100 萬個輸出文字詞元 不適用 不適用


    Gemini 2.0 Flash Lite
    100 萬個輸入詞元 $1.00 美元 $0.01875
    100 萬個輸入音訊詞元 $1.00 美元 $0.01875
    100 萬個輸出文字詞元 不適用 不適用

    根據模態計費

    以下模態定價僅供參考,是根據平均應用實例計算而得。實際計費方式只會根據權杖數量:

    • 4 個字元約等於 1 個文字權杖 (含空格)。
    • 舉例來說,1024x1024 圖片會消耗 1290 個符元。每個圖片權杖的數量會因圖片解析度而異。如要進一步瞭解如何計算符元,請參閱我們的說明文件
    • 在每秒一影格的取樣率下,影片輸入內容每秒會消耗 258 個權杖。含音訊的影片會同時產生影片和音訊權杖的費用。
    • 沒有時間戳記的音訊輸入內容,每秒會消耗 25 個詞元。

    模型

    類型
    儲存空間
    (模態-小時)

    價格




    Gemini 2.0 Flash
    輸入文字 (每 100 萬字元的費用) $0.25 美元 $0.009375
    輸入圖片 (每張圖片的費用) $0.00129 $0.000048375
    輸入影片 ($/秒) $0.000258 $0.000009675
    輸入音訊 ($/秒) $0.000025 $0.00000625
    輸出文字 (每 100 萬字元) 不適用 不適用




    Gemini 2.0 Flash Lite
    輸入文字 (每 100 萬字元的費用) $0.25 美元 $0.0046875
    輸入圖片 (每張圖片的費用) $0.00129 $0.0000241875
    輸入影片 ($/秒) $0.000258 $0.000009675
    輸入音訊 ($/秒) $0.000258 $0.0000048375
    輸出文字 (每 100 萬字元) 不適用 不適用


    以 Google 搜尋建立基準
    Gemini 2.0 Flash 每天最多可處理 1,500 個基礎要求,不需額外付費。每日超過 1,500 次的
    基礎要求,每 1,000 次要求將收取 $35 美元 (每日最多 100 萬次要求)。

    如果每天需要超過 100 萬次要求,請與帳戶團隊聯絡。

    以企業適用的網路內容建立基準
    自 2025 年 5 月 5 日起,每 1,000 個要求 $45 美元 (每日最多 100 萬個要求)。

    如果每天需要超過 100 萬次要求,請與帳戶團隊聯絡。

    * 價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
    * PDF 會以圖像輸入計費,一個 PDF 頁面相當於一張圖像。
    * 微調模型端點的預測價格與基礎模型相同。
    * 只有在要求傳回的結果包含至少一個來自網路的基礎支援網址時,才會針對 Google 搜尋基礎功能收費。此外,您也必須支付標準 Gemini 模型使用費。

    佈建輸送量

    佈建的處理量 可確保生成式 AI 需求獲得足夠的處理量,交易單位為 生成式 AI 擴充單元 (GSU)。 如要進一步瞭解各項 GSU 提供的輸送量,請按這裡 並使用我們的線上估算工具,請按這裡

    時間長度 每位 GSU 使用者價格
    1 週承諾 $1,200
    綁約 1 個月 $2,700
    綁約 3 個月 $2,400
    1 年承諾使用合約 $2,000 美元

    費用計算範例

    使用者需要確保 gemini-2.0-flash 能支援每秒 10 次查詢 (QPS),且每次查詢的輸入內容為 1,000 個文字權杖和 500 個音訊權杖,輸出內容為 300 個文字權杖。

    根據 gemini-2.0-flash 的輸送量和消耗率,我們知道輸入文字詞元的消耗率為 1 個詞元、輸入音訊詞元的消耗率為 7 個詞元,而輸出文字詞元的消耗率為 4 個詞元。

    使用者的輸入詞元總數為 1,000* (每個輸入文字詞元 1 個詞元) + 500* (每個輸入音訊詞元 7 個詞元) = 4,500 個扣除額度調整後的輸入詞元。使用者的輸出詞元總數為 300* (每個輸出文字詞元 4 個詞元) = 1,200 個扣除調整後的輸出詞元。將兩者相加,得出 4,500 個經調整的輸入詞元 + 1,200 個經調整的輸出詞元 = 5,700 個查詢總詞元。

    將每項查詢的總權杖數乘以 QPS,即可得出每秒總權杖數:5,700 個總權杖數/查詢 * 10 QPS = 57,000 個總權杖數/秒。

    將這個數字除以每個 GSU 的每秒總輸送量,可得出 57,000 個每秒總權杖數 ÷ 每個 GSU 的每秒 3,360 個輸送量 = 16.96 個 GSU。這個模型的最低 GSU 購買增量為 1,因此使用者需要 17 個 GSU。

    如果使用者想維持這個輸送量 1 週,費用將為 $1,200 美元 * 17 個 GSU = 每週 $20,400 美元。如果他們想維持這個輸送量 1 個月,費用將為 $2,700 * 17 個 GSU = 每月 $45,900 美元。如果他們想維持這個輸送量 3 個月,每月費用將為 $2,400 * 17 GSUs = $40,800。最後,如果他們想維持這個輸送量 1 年,每個月的費用將是 $2,000 * 17 GSUs = $34,000。

    模型調整

    模型調整是根據任務自訂大型模型的有效方法。這是提升模型品質和效率的關鍵步驟。模型微調有下列好處:

    • 針對特定工作提供更高品質的輸出內容
    • 提升模型穩健性
    • 提示較短,因此推論延遲時間和成本較低

    調整作業會按每百萬個訓練詞元計費。訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。在模型推論方面,Gemini 微調模型端點的預測價格與基礎模型相同。

    型號 類型 價格 (每 100 萬個訓練權杖)
    Gemini 2.5 Pro 監督式微調 $25
    Gemini 2.5 Flash 監督式微調
    偏好調整
    $5 美元
    Gemini 2.5 Flash Lite 監督式微調
    偏好調整
    $1.5
    Gemma 3 27B IT 監督式微調 $6.83
    Llama 3.1 8B 監督式微調 $0.67
    Llama 3.2 1B 監督式微調 $0.28
    Llama 3.2 3B 監督式微調 $0.61
    Llama 3.3 70B 監督式微調 $6.72
    Llama 4 Scout 17B 16E 監督式微調 $5.77
    Qwen 3 32B 監督式微調 $6.57

    * 訓練詞元數量是訓練資料集中的詞元總數乘以訓練週期數。
    * Gemini 微調模型端點的預測價格與基礎模型相同。

    比較 Vertex AI 合作夥伴模型的定價

    合作夥伴模型是 Google 合作夥伴開發的精選生成式 AI 模型。合作夥伴模型以代管 API 形式提供。詳情請參閱合作夥伴模型總覽。 以下各節列出 Google 合作夥伴模型的定價詳細資料。

    AI21 Labs 的模型

    型號 定價
    Jamba 1.5 Large (已淘汰) 輸入:每 100 萬個詞元 $2 美元
    輸出:每 100 萬個詞元 $8 美元
    Jamba 1.5 Mini (已淘汰) 輸入:每 100 萬個詞元 $0.20 美元
    輸出:每 100 萬個詞元 $0.40 美元

    Anthropic 的 Claude 模型

    提供區域定價的機型

    全球

    型號 價格 (每 100 萬個符記) < 20 萬個輸入符記 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元
    Claude Opus 4.5 輸入:$5.00
    輸出:$25.00

    批次輸入:$2.50
    批次輸出:$12.50

    5 分鐘快取寫入:$6.25
    1 小時快取寫入:$10.00

    快取命中:$0.50

    5 分鐘批次快取寫入:$3.125
    1 小時批次快取寫入:$5.00
    批次快取命中:$0.25
    Claude Sonnet 4.5 輸入:$3.00 美元
    輸出:$15.00 美元

    批次輸入:$1.50 美元
    批次輸出:$7.50 美元

    5 分鐘快取寫入:$3.75 美元
    1 小時快取寫入:$6.00 美元

    快取命中:$0.30 美元

    批次快取寫入:$1.88 美元
    批次快取命中:$0.15 美元
    輸入:$6.00 美元
    輸出:$22.50 美元

    批次輸入:$3.00 美元
    批次輸出:$11.25 美元

    5 分鐘快取寫入:$7.50 美元
    1 小時快取寫入:$12.00 美元

    快取命中:$0.60 美元

    批次快取寫入:$3.75 美元
    批次快取命中:$0.30 美元
    Claude Haiku 4.5 輸入:$1.00 美元
    輸出:$5.00 美元

    批次輸入:$0.50 美元
    批次輸出:$2.50 美元

    5 分鐘快取寫入:$1.25 美元
    1 小時快取寫入:$2.00 美元

    快取命中:$0.10 美元

    批次快取寫入:$0.625 美元
    批次快取命中:$0.05 美元

    us-east5

    型號 價格 (每 100 萬個符記) < 20 萬個輸入符記 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元
    Claude Opus 4.5 輸入:$5.50 美元
    輸出:$27.50 美元

    批次輸入:$2.75 美元
    批次輸出:$13.75 美元

    5 分鐘快取寫入:$6.875 美元
    1 小時快取寫入:$11.00 美元

    快取命中:$0.55 美元

    5 分鐘批次快取寫入:$3.438 美元
    1 小時批次快取寫入:$5.50 美元
    批次快取命中:$0.275 美元
    Claude Sonnet 4.5 輸入:$3.30 美元
    輸出:$16.50 美元

    批次輸入:$1.65 美元
    批次輸出:$8.25 美元

    5 分鐘快取寫入:$4.13 美元
    1 小時快取寫入:$6.60 美元

    快取命中:$0.33 美元

    批次快取寫入:$2.06 美元
    批次快取命中:$0.17 美元
    輸入:$6.60 美元
    輸出:$24.75 美元

    批次輸入:$3.30 美元
    批次輸出:$12.38 美元

    5 分鐘快取寫入:$8.25 美元
    1 小時快取寫入:$13.20 美元

    快取命中:$0.66 美元

    批次快取寫入:$4.13 美元
    批次快取命中:$0.33 美元
    Claude Haiku 4.5 輸入:$1.10 美元
    輸出:$5.50 美元

    批次輸入:$0.55 美元
    批次輸出:$2.75 美元

    5 分鐘快取寫入:$1.375 美元
    1 小時快取寫入:$2.20 美元

    快取寫入:$1.375 美元
    快取命中:$0.11 美元

    批次快取寫入:$0.688 美元
    批次快取命中:$0.055 美元

    europe-west1

    型號 價格 (每 100 萬個符記) < 20 萬個輸入符記 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元
    Claude Opus 4.5 輸入:$5.50 美元
    輸出:$27.50 美元

    批次輸入:$2.75 美元
    批次輸出:$13.75 美元

    5 分鐘快取寫入:$6.875 美元
    1 小時快取寫入:$11.00 美元

    快取命中:$0.55 美元

    5 分鐘批次快取寫入:$3.438 美元
    1 小時批次快取寫入:$5.50 美元
    批次快取命中:$0.275 美元
    Claude Sonnet 4.5 輸入:$3.30 美元
    輸出:$16.50 美元

    批次輸入:$1.65 美元
    批次輸出:$8.25 美元

    5 分鐘快取寫入:$4.13 美元
    1 小時快取寫入:$6.60 美元

    快取命中:$0.33 美元

    批次快取寫入:$2.06 美元
    批次快取命中:$0.17 美元
    輸入:$6.60 美元
    輸出:$24.75 美元

    批次輸入:$3.30 美元
    批次輸出:$12.38 美元

    5 分鐘快取寫入:$8.25 美元
    1 小時快取寫入:$13.20 美元

    快取命中:$0.66 美元

    批次快取寫入:$4.13 美元
    批次快取命中:$0.33 美元
    Claude Haiku 4.5 輸入:$1.10 美元
    輸出:$5.50 美元

    批次輸入:$0.55 美元
    批次輸出:$2.75 美元

    5 分鐘快取寫入:$1.375 美元
    1 小時快取寫入:$2.20 美元

    快取命中:$0.11 美元

    批次快取寫入:$0.688 美元
    批次快取命中:$0.055 美元

    asia-southeast1

    型號 價格 (每 100 萬個符記) < 20 萬個輸入符記 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元
    Claude Opus 4.5 輸入:$5.50 美元
    輸出:$27.50 美元

    批次輸入:$2.75 美元
    批次輸出:$13.75 美元

    5 分鐘快取寫入:$6.875 美元
    1 小時快取寫入:$11.00 美元

    快取命中:$0.55 美元

    5 分鐘批次快取寫入:$3.438 美元
    1 小時批次快取寫入:$5.50 美元
    批次快取命中:$0.275 美元
    Claude Sonnet 4.5 輸入:$3.30 美元
    輸出:$16.50 美元

    批次輸入:$1.65 美元
    批次輸出:$8.25 美元

    5 分鐘快取寫入:$4.13 美元
    1 小時快取寫入:$6.60 美元

    快取命中:$0.33 美元

    批次快取寫入:$2.06 美元
    批次快取命中:$0.17 美元
    輸入:$6.60 美元
    輸出:$24.75 美元

    批次輸入:$3.30 美元
    批次輸出:$12.38 美元

    5 分鐘快取寫入:$8.25 美元
    1 小時快取寫入:$13.20 美元

    快取命中:$0.66 美元

    批次快取寫入:$4.13 美元
    批次快取命中:$0.33 美元

    asia-east1

    型號 價格 (每 100 萬個符記) < 20 萬個輸入符記 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元
    Claude Haiku 4.5 輸入:$1.10 美元
    輸出:$5.50 美元

    批次輸入:$0.55 美元
    批次輸出:$2.75 美元

    5 分鐘快取寫入:$1.375 美元
    1 小時快取寫入:$2.20 美元

    快取寫入:$1.375 美元
    快取命中:$0.11 美元

    批次快取寫入:$0.688 美元
    批次快取命中:$0.055 美元

    * 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元,則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。

    所有區域的價格都相同的模型

    型號 價格 (每 100 萬個符記) < 20 萬個輸入符記 價格 (每 100 萬個詞元) >= 20 萬個輸入詞元
    Claude Opus 4.1 輸入:$15
    輸出:$75

    批次輸入:$7.50
    批次輸出:$37.50

    5 分鐘快取寫入:$18.75
    1 小時快取寫入:$30

    快取命中:$1.50

    批次快取寫入:$9.375
    批次快取命中:$0.75
    不適用
    Claude Opus 4 輸入:$15
    輸出:$75

    批次輸入:$7.50
    批次輸出:$37.50

    5 分鐘快取寫入:$18.75
    1 小時快取寫入:$30

    快取命中:$1.50

    批次快取寫入:$9.375
    批次快取命中:$0.75
    不適用
    Claude Sonnet 4 輸入:$3 美元
    輸出:$15 美元

    批次輸入:$1.50 美元
    批次輸出:$7.50 美元

    5 分鐘快取寫入:$3.75 美元
    1 小時快取寫入:$6.00 美元

    快取命中:$0.30 美元

    批次快取寫入:$1.875 美元
    批次快取命中:$0.15 美元
    輸入:$6 美元
    輸出:$22.50 美元

    批次輸入:$3 美元
    批次輸出:$11.25 美元

    5 分鐘快取寫入:$7.50 美元
    1 小時快取寫入:$12.00 美元

    快取命中:$0.60 美元

    批次快取寫入:$3.75 美元
    批次快取命中:$0.30 美元
    Claude 3.5 Haiku 輸入:$0.80
    輸出:$4

    批次輸入:$0.40
    批次輸出:$2

    5 分鐘快取寫入:$1
    1 小時快取寫入:$1.60

    快取命中:$0.08

    批次快取寫入:$0.50
    批次快取命中:$0.04
    不適用
    Claude 3 Haiku 輸入:$0.25
    輸出:$1.25

    5 分鐘快取寫入:$0.30
    1 小時快取寫入:$0.50

    快取命中:$0.03
    不適用
    Claude 3.7 Sonnet (已淘汰) 輸入:$3 美元
    輸出:$15 美元

    批次輸入:$1.50 美元
    批次輸出:$7.50 美元

    快取寫入:$3.75 美元
    快取命中:$0.30 美元

    批次快取寫入:$1.875 美元
    批次快取命中:$0.15 美元
    不適用
    Claude 3.5 Sonnet v2 (已淘汰) 輸入:$3 美元
    輸出:$15 美元

    批次輸入:$1.50 美元
    批次輸出:$7.50 美元

    快取寫入:$3.75 美元
    快取命中:$0.30 美元

    批次快取寫入:$1.875 美元
    批次快取命中:$0.15 美元
    不適用
    Claude 3.5 Sonnet (已淘汰) 輸入:$3
    輸出:$15

    快取寫入:$3.75
    快取命中:$0.30
    不適用
    Claude 3 Opus (已淘汰) 輸入:$15
    輸出:$75

    快取寫入:$18.75
    快取命中:$1.50
    不適用

    * 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元,則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。

    工具定價

    工具 費用
    網頁搜尋要求 每 1,000 次搜尋$10 美元
    支援的模型:Claude Haiku 4.5、Claude Sonnet 4.5、Claude Sonnet 4、Claude Opus 4.1 和 Claude Opus 4。

    * 如果查詢輸入內容的背景資訊長度達到或超過 20 萬個符元,則所有符元 (輸入和輸出) 都會以長背景資訊費率計費。

    Deepseek 的模型

    型號 定價
    DeepSeek-V3.1 輸入:每 100 萬個詞元 $0.60 美元
    輸出:每 100 萬個詞元 $1.70 美元

    批次輸入:每 100 萬個詞元 $0.30 美元
    批次輸出:每 100 萬個詞元 $0.85 美元
    DeepSeek-V3.2 * 輸入:每 100 萬個詞元 $0.56 美元
    輸出:每 100 萬個詞元 $1.68 美元

    批次輸入:每 100 萬個詞元 $0.28 美元
    批次輸出:每 100 萬個詞元 $0.84 美元
    DeepSeek-R1 (0528) 輸入:每 100 萬個詞元 $1.35 美元
    輸出:每 100 萬個詞元 $5.40 美元

    批次輸入:每 100 萬個詞元 $0.675 美元
    批次輸出:每 100 萬個詞元 $2.70 美元
    DeepSeek-OCR 輸入:每 100 萬個詞元 $0.30 美元 (或每頁 $0.0003 美元)
    輸出:每 100 萬個詞元 $1.20 美元 (或每頁 $0.00012 美元)
    • 2025 年 12 月 17 日前免費。

    MiniMax 的模型

    型號 定價
    MiniMax-M2 輸入:每 100 萬個詞元 $0.30 美元
    輸出:每 100 萬個詞元 $1.20 美元

    Moonshot 的模型

    型號 定價
    Kimi-K2-Thinking 輸入:每 100 萬個詞元 $0.60 美元
    輸出:每 100 萬個詞元 $2.50 美元

    Qwen 的模型

    型號 定價
    Qwen3-Next-80B-Thinking 輸入:每 100 萬個詞元 $0.15 美元
    輸出:每 100 萬個詞元 $1.20 美元
    Qwen3-Next-80B-Instruct 輸入:每 100 萬個詞元 $0.15 美元
    輸出:每 100 萬個詞元 $1.20 美元
    Qwen3-Coder-480B-A35B-Instruct 輸入:每 100 萬個詞元 $0.22 美元
    輸出:每 100 萬個詞元 $1.80 美元

    批次輸入:每 100 萬個詞元 $0.11 美元
    批次輸出:每 100 萬個詞元 $0.90 美元
    Qwen3-235B-A22B-Instruct-2507 輸入:每 100 萬個詞元 $0.22 美元
    輸出:每 100 萬個詞元 $0.88 美元

    批次輸入:每 100 萬個詞元 $0.11 美元
    批次輸出:每 100 萬個詞元 $0.44 美元

    OpenAI 模型

    型號 定價
    gpt-oss-120b 輸入:每 100 萬個詞元 $0.09 美元
    輸出:每 100 萬個詞元 $0.36 美元

    批次輸入:每 100 萬個詞元 $0.045 美元
    批次輸出:每 100 萬個詞元 $0.18 美元
    gpt-oss-20b 輸入:每 100 萬個詞元 $0.07 美元
    輸出:每 100 萬個詞元 $0.25 美元

    批次輸入:每 100 萬個詞元 $0.035 美元
    批次輸出:每 100 萬個詞元 $0.125 美元

    Meta 的 Llama 模型

    型號 定價
    Llama 3.1 405B 輸入:每 100 萬個詞元 $5.00 美元
    輸出:每 100 萬個詞元 $16.00 美元
    Llama 3.3 70B 輸入:每 100 萬個詞元 $0.72 美元
    輸出:每 100 萬個詞元 $0.72 美元

    批次輸入:每 100 萬個詞元 $0.36 美元
    批次輸出:每 100 萬個詞元 $0.36 美元
    Llama 4 Scout 輸入:每 100 萬個詞元 $0.25 美元
    輸出:每 100 萬個詞元 $0.70 美元

    批次輸入:每 100 萬個詞元 $0.125 美元
    批次輸出:每 100 萬個詞元 $0.35 美元
    Llama 4 Maverick 輸入:每 100 萬個詞元 $0.35 美元
    輸出:每 100 萬個詞元 $1.15 美元

    批次輸入:每 100 萬個詞元 $0.175 美元
    批次輸出:每 100 萬個詞元 $0.575 美元

    Mistral AI 的模型

    型號 定價
    Mistral OCR (25.05) 輸入:每 100 萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元)
    輸出:每 100 萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元)
    Mistral Medium 3 輸入:每 100 萬個詞元 $0.40 美元
    輸出:每 100 萬個詞元 $2.00 美元
    Mistral Small 3.1 (25.03) 輸入:每 100 萬個詞元 $0.10 美元
    輸出:每 100 萬個詞元 $0.30 美元
    Mistral Large (24.11) (已淘汰) 輸入:每 100 萬個詞元 $2.00 美元
    輸出:每 100 萬個詞元 $6.00 美元
    Codestral 2 輸入:每百萬個詞元 $0.30 美元
    輸出:每百萬個詞元 $0.90 美元
    Codestral (25.01) (已淘汰) 輸入:每百萬個詞元 $0.30 美元
    輸出:每百萬個詞元 $0.90 美元

    索取客製化報價

    Google Cloud 提供「即付即用」計費模式,您只需要為所用服務付費。貴機構如需索取客製化的報價,請與我們的銷售團隊聯絡。
    聯絡銷售人員