English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

控制台

聯絡我們免費試用

本頁面由 Cloud Translation API 翻譯而成。

Vertex AI 推論 API 錯誤的生成式 AI

本指南列出使用生成式 AI 模型 API 參考資料時可能遇到的錯誤。這些錯誤遵循 Google Cloud API 的錯誤模型，建議我們提供生成式 AI 模型專屬的原因和解決方案指南。

API 錯誤

下表提供 API 錯誤代碼和說明。

HTTP 錯誤代碼	標準化錯誤代碼	原因	範例	解決方案
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	要求未通過 API 驗證，或是您嘗試存取需要加入允許清單的模型，或機構政策禁止使用的模型。	要求超出模型的輸入權杖限制。	如需要求參數、權杖計數和其他參數，請參閱生成式 AI 的模型 API 參考資料。
403	`PERMISSION_DENIED`	用戶端權限不足，無法呼叫 API。	服務帳戶沒有權限存取儲存圖片或影片資源的 Cloud Storage 值區。	1. 確認已啟用所有必要的 API，且服務帳戶具備存取所選 Vertex AI 服務的正確權限。 2. 系統會授予 Vertex AI 每個產品、每個專案的服務帳戶 (P4SA) 必要權限，以存取輸入內容中參照的資源。
404	`NOT_FOUND`	在指定網址找不到有效物件。	在儲存空間網址中找不到圖片檔案。	檢查並修正檔案位置。
429	`RESOURCE_EXHAUSTED`	視錯誤訊息而定，錯誤可能由下列原因造成： 1. API 配額超過上限。 2. 共用伺服器容量導致伺服器超載。 3. 您已達到使用 `logprobs` 的每日要求次數上限。	Gemini API 超出每分鐘要求數上限。	1. 請查看 Vertex AI Generative AI 配額限制。如有需要，請申請更多配額。 2. 請稍後再試。如果錯誤持續發生一段時間 (數小時)，請與 Vertex AI 支援團隊聯絡。 3. 建議購買「佈建的處理量」。
499	`CANCELLED`	用戶端已取消要求。
500	`UNKNOWN / INTERNAL`	伺服器超載或依附元件故障，導致伺服器發生錯誤。	服務暫時超載，因此要求受到限制。	請稍後再試。如果錯誤持續發生一段時間 (數小時)，請與 Vertex AI 支援團隊聯絡。
503	`UNAVAILABLE`	這項服務暫時無法使用。	伺服器未回應傳入的要求。	「無法使用」狀態可能只是暫時的。不過，如果錯誤持續發生，請與 Vertex AI 支援團隊聯絡。
504	`DEADLINE_EXCEEDED`	用戶端設定的期限短於伺服器的預設期限 (10 分鐘)，且要求未在用戶端提供的期限內完成。	建議延長客戶提供的期限。

處理錯誤

避免流量突然爆增。尖峰是指在極短時間內，要求數量突然大幅增加。有時流量暴增可能會導致配額強制執行問題，並增加伺服器過載的機率。

請謹慎重試事件。建議最多重試兩次。延遲時間下限為一秒，後續要求會以指數方式輪詢。

後續步驟

Vertex AI 生成式 AI 有一些限制。詳情請參閱「PaLM API 限制」。
使用 Vertex AI Studio 或 Vertex AI API 進行快速入門教學課程。
探索 Model Garden 中的預先訓練模型。
瞭解配額與限制。
瞭解定價。

除非另有註明，否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權，程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間：2025-10-19 (世界標準時間)。