Vertex AI 上的生成式 AI 推理 API 错误

本指南提供了您在使用生成式 AI 的 Model API 参考文档时可能会遇到的错误列表。这些错误遵循 Google Cloud API 的错误模型,该模型建议我们提供特定于生成式 AI 模型的原因和解决方案的指导。

API 错误

下表提供了 API 错误代码和说明。

HTTP 错误代码 规范错误代码 原因 示例 解决方案
400 INVALID_ARGUMENT / FAILED_PRECONDITION 请求未通过 API 验证,或者您尝试访问的模型需要列入许可名单或组织政策不允许。 请求超出了模型的输入词元限制。 如需了解请求参数、词元数和其他参数,请参阅适用于生成式 AI 的 Model API 参考文档
403 PERMISSION_DENIED 客户端没有足够的权限来调用 API。 服务账号无权访问托管图片或视频资源的 Cloud Storage 存储桶。 1. 验证所有必要的 API 均已启用,以及服务账号是否具有访问所选 Vertex AI 服务的适当权限。

2. Vertex AI 每个产品、每个项目的服务账号 (P4SA) 具有访问输入中引用的资源所需的权限。
404 NOT_FOUND 未在指定网址中找到有效对象。 在存储网址中找不到图片文件。 检查并修复文件位置。
429 RESOURCE_EXHAUSTED 根据错误消息,错误可能是由以下原因造成的:

1. API 配额超出限制。

2. 共享服务器容量导致服务器过载。
Gemini API 超出了每分钟请求数限制。 1. 查看 Vertex AI 生成式 AI 配额限制。如果需要,请申请更高的配额。

2. 请过几秒后重试。如果错误在很长一段时间(几小时)后仍然存在,请与 Vertex AI 支持团队联系。
499 CANCELLED 请求被客户端取消。
500 UNKNOWN / INTERNAL 由于过载或依赖项故障而导致服务器错误。 由于服务暂时过载,请求受到限制。 请过几秒后重试。如果错误在很长一段时间(几小时)后仍然存在,请与 Vertex AI 支持团队联系。
503 UNAVAILABLE 暂时无法使用服务。 服务器未响应传入请求。 不可用状态可能是暂时的。但是,如果错误仍然存在,请与 Vertex AI 支持团队联系。
504 DEADLINE_EXCEEDED 客户端设置的时限比服务器的默认时限(10 分钟)短,并且请求未在客户端提供的时限内完成。 请考虑延长客户端提供的截止时间。

处理错误

避免流量高峰。高峰是指在很短的时间内请求数量突然大幅度增加。有时,流量高峰可能会导致配额强制执行出现问题,并且可能会增加服务器过载的可能性。

重试事件时请务必小心。我们建议您最多重试两次。最短延迟为 1 秒,后续请求会以指数方式备份。

后续步骤