「已佈建的處理量」是固定費用的訂閱服務,提供多種期限長度,可為 Vertex AI 上的支援生成式 AI 模型預留處理量。如要預留處理量,您必須指定模型和模型執行的可用位置。 「已佈建的處理量」是使用生成式 AI 模型的兩種方式之一。另一個選項是即付即用,也稱為隨選。下表比較這兩個選項。 如果您的用途符合下列任一情況,建議使用佈建輸送量:佈建輸送量簡介
使用佈建輸送量的時機
選項
說明
用途
佈建輸送量
以固定費用預留特定期間的模型處理容量,確保效能一致。
需要高且穩定處理量和可預測費用的正式版應用程式 (例如即時聊天機器人)。
即付即用 (隨選)
您只需要為使用的資源付費,無須預繳費用。容量共用,且視可用情形而定。
開發、測試或流量不穩定/無法預測的應用程式。
後續步驟
已佈建的處理量總覽
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-08-19 (世界標準時間)。