Vertex AI 推論 API 錯誤的生成式 AI

本指南列出使用生成式 AI 模型 API 參考資料時可能遇到的錯誤。這些錯誤遵循 Google Cloud API 的錯誤模型,建議我們提供生成式 AI 模型專屬的原因和解決方案指南。

API 錯誤

下表提供 API 錯誤代碼和說明。

HTTP 錯誤代碼 標準化錯誤代碼 原因 範例 解決方案
400 INVALID_ARGUMENT / FAILED_PRECONDITION 要求未通過 API 驗證,或是您嘗試存取需要加入允許清單的模型,或機構政策禁止使用的模型。 要求超出模型的輸入權杖限制。 如需要求參數、權杖計數和其他參數,請參閱生成式 AI 的模型 API 參考資料
403 PERMISSION_DENIED 用戶端權限不足,無法呼叫 API。 服務帳戶沒有權限存取儲存圖片或影片資源的 Cloud Storage 值區。 1. 確認已啟用所有必要的 API,且服務帳戶具備存取所選 Vertex AI 服務的正確權限

2. 系統會授予 Vertex AI 每個產品、每個專案的服務帳戶 (P4SA) 必要權限,以存取輸入內容中參照的資源。
404 NOT_FOUND 在指定網址找不到有效物件。 在儲存空間網址中找不到圖片檔案。 檢查並修正檔案位置。
429 RESOURCE_EXHAUSTED 視錯誤訊息而定,錯誤可能由下列原因造成:

1. API 配額超過上限。

2. 共用伺服器容量導致伺服器超載。

3. 您已達到使用 logprobs 的每日要求次數上限。
Gemini API 超出每分鐘要求數上限。 1. 請查看 Vertex AI Generative AI 配額限制。如有需要,請申請更多配額。

2. 請稍後再試。如果錯誤持續發生一段時間 (數小時),請與 Vertex AI 支援團隊聯絡。

3. 建議購買「佈建的處理量」
499 CANCELLED 用戶端已取消要求。
500 UNKNOWN / INTERNAL 伺服器超載或依附元件故障,導致伺服器發生錯誤。 服務暫時超載,因此要求受到限制。 請稍後再試。如果錯誤持續發生一段時間 (數小時),請與 Vertex AI 支援團隊聯絡。
503 UNAVAILABLE 這項服務暫時無法使用。 伺服器未回應傳入的要求。 「無法使用」狀態可能只是暫時的。不過,如果錯誤持續發生,請與 Vertex AI 支援團隊聯絡。
504 DEADLINE_EXCEEDED 用戶端設定的期限短於伺服器的預設期限 (10 分鐘),且要求未在用戶端提供的期限內完成。 建議延長客戶提供的期限。

處理錯誤

避免流量突然爆增。尖峰是指在極短時間內,要求數量突然大幅增加。有時流量暴增可能會導致配額強制執行問題,並增加伺服器過載的機率。

請謹慎重試事件。建議最多重試兩次。延遲時間下限為一秒,後續要求會以指數方式輪詢。

後續步驟