自 2025 年 4 月 29 日起,Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型將無法用於先前未使用這些模型的專案,包括新專案。詳情請參閱「
模型版本和生命週期」。
已佈建的處理量總覽
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
本頁說明佈建輸送量,以及何時應使用這項功能。
佈建輸送量簡介
「佈建的處理量」是固定費用、固定期限的訂閱方案,提供多種期限長度,可為 Vertex AI 上的支援生成式 AI 模型預留處理量。如要預留處理量,您必須指定模型和模型執行的可用位置。
使用佈建輸送量的時機
如果下列任一考量事項適用於您的用途,請考慮使用佈建輸送量:
- 您要建構即時生成式 AI 實際工作環境應用程式,例如聊天機器人和代理程式。
- 重要工作負載一律需要高處理量。輸送量測量取決於模型。
- 您希望為應用程式使用者提供一致且可預期的體驗。
- 您想支付固定月費或週費,並控管超額費用,以確定生成式 AI 費用。
「佈建的處理量」是使用生成式 AI 模型的兩種方式之一。第二種是隨選即付,又稱為「隨選」。
後續步驟
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-09-12 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-09-12 (世界標準時間)。"],[],[],null,[]]