English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

控制台

聯絡我們免費試用

本頁面由 Cloud Translation API 翻譯而成。

已佈建的處理量總覽

本頁說明佈建輸送量，以及何時應使用這項功能。

佈建輸送量簡介

「佈建的處理量」是固定費用、固定期限的訂閱方案，提供多種期限長度，可為 Vertex AI 上的支援生成式 AI 模型預留處理量。如要預留處理量，您必須指定模型和模型執行的可用位置。

使用佈建輸送量的時機

如果下列任一考量事項適用於您的用途，請考慮使用佈建輸送量：

您要建構即時生成式 AI 實際工作環境應用程式，例如聊天機器人和代理程式。
重要工作負載一律需要高處理量。輸送量測量取決於模型。
您希望為應用程式使用者提供一致且可預期的體驗。
您想支付固定月費或週費，並控管超額費用，以確定生成式 AI 費用。

「佈建的處理量」是使用生成式 AI 模型的兩種方式之一。第二種是隨選即付，又稱為「隨選」。

後續步驟

使用佈建輸送量的支援模型。

除非另有註明，否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權，程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間：2025-09-30 (世界標準時間)。