已佈建的處理量總覽

本頁面提供佈建輸送量總覽,並與隨用隨付方案比較。涵蓋下列主題:

佈建輸送量簡介

「已佈建的處理量」是固定費用的訂閱服務,提供多種期限長度,可為 Vertex AI 上的支援生成式 AI 模型預留處理量。如要預留處理量,您必須指定模型和模型執行的可用位置

使用佈建輸送量的時機

「已佈建的處理量」是使用生成式 AI 模型的兩種方式之一。另一個選項是即付即用,也稱為隨選。下表比較這兩個選項。

選項 說明 用途
佈建輸送量 以固定費用預留特定期間的模型處理容量,確保效能一致。 需要高且穩定處理量和可預測費用的正式版應用程式 (例如即時聊天機器人)。
即付即用 (隨選) 您只需要為使用的資源付費,無須預繳費用。容量共用,且視可用情形而定。 開發、測試或流量不穩定/無法預測的應用程式。

如果您的用途符合下列任一情況,建議使用佈建輸送量:

  • 您正在建構即時生成式 AI 製作應用程式,例如聊天機器人和代理程式。
  • 重要工作負載一律需要高處理量。視型號而定,輸送量測量方式會有所不同。
  • 您希望為使用者提供一致且可預期的體驗。
  • 您希望透過固定價格預估生成式 AI 費用,並控管超額費用。

後續步驟