已佈建的處理量總覽

本頁說明佈建輸送量,以及何時應使用這項功能。

佈建輸送量簡介

「佈建的處理量」是固定費用、固定期限的訂閱方案,提供多種期限長度,可為 Vertex AI 上的支援生成式 AI 模型預留處理量。如要預留處理量,您必須指定模型和模型執行的可用位置

使用佈建輸送量的時機

如果下列任一考量事項適用於您的用途,請考慮使用佈建輸送量:

  • 您要建構即時生成式 AI 實際工作環境應用程式,例如聊天機器人和代理程式。
  • 重要工作負載一律需要高處理量。輸送量測量取決於模型。
  • 您希望為應用程式使用者提供一致且可預期的體驗。
  • 您想支付固定月費或週費,並控管超額費用,以確定生成式 AI 費用。

「佈建的處理量」是使用生成式 AI 模型的兩種方式之一。第二種是隨選即付,又稱為「隨選」

後續步驟