Vertex AI 上的生成式 AI 推理 API 错误

本指南提供了您在使用适用于生成式 AI 的模型 API 参考文档时可能会遇到的错误列表。这些错误遵循 Google Cloud API 的错误模型,该模型建议我们针对特定于生成式 AI 模型的原因和解决方案提供指导。

API 错误

下表列出了 API 错误代码及其说明。

HTTP 错误代码 规范错误代码 原因 示例 解决方案
400 INVALID_ARGUMENT / FAILED_PRECONDITION 请求未通过 API 验证,或者您尝试访问需要列入许可名单或被组织政策禁止的模型。 请求超出模型的输入词元上限。 如需了解请求参数、词元数和其他参数,请参阅适用于生成式 AI 的模型 API 参考文档
403 PERMISSION_DENIED 客户端没有足够的权限来调用 API。 服务账号无权访问托管图片或视频资源的 Cloud Storage 存储桶。 1. 验证是否已启用所有必要的 API,并且服务账号是否拥有访问所选 Vertex AI 服务的权限。

2. Vertex AI 产品和项目专属服务账号 (P4SA) 被授予所需权限,可访问输入中引用的资源。
404 NOT_FOUND 未在指定网址中找到任何有效对象。 未在存储网址中找到图片文件。 检查并修复文件位置。
429 RESOURCE_EXHAUSTED 根据错误消息,此错误可能由以下原因引起:

1. API 配额超出限制。

2. 由于共享服务器容量而发生服务器过载。
Gemini API 超出每分钟请求数上限。 1. 查看 Vertex AI 生成式 AI 配额限制。如果需要,请申请更高的配额。

2. 请在几秒钟后重试。如果错误在长时间(数小时)后仍然存在,请与 Vertex AI 支持团队联系。
499 CANCELLED 请求被客户端取消。
500 UNKNOWN / INTERNAL 由于过载或依赖项失败而发生服务器错误。 由于服务暂时过载,因此请求受到限制。 请在几秒钟后重试。如果错误在长时间(数小时)后仍然存在,请与 Vertex AI 支持团队联系。
503 UNAVAILABLE 暂时无法使用服务。 服务器未响应传入请求。 不可用状态可能是暂时的。但是,如果错误仍然存在,请与 Vertex AI 支持团队联系。
504 DEADLINE_EXCEEDED 客户端设置的截止时限比服务器的默认截止时限(10 分钟)短,请求未在客户端提供的截止时限内完成。 考虑延长客户提供的截止时限。

处理错误

避免流量高峰。高峰是指在很短的时间内请求数量突然大幅度增加。有时,流量高峰可能会导致配额强制执行问题,并可能会增加服务器过载的可能性。

重试事件时请务必小心。建议您最多重试两次。最短延迟时间为 1 秒,延迟时间会随着后续请求以指数方式增加。

后续步骤