本指南提供了您在使用适用于生成式 AI 的模型 API 参考文档时可能会遇到的错误列表。这些错误遵循 Google Cloud API 的错误模型,该模型建议我们针对特定于生成式 AI 模型的原因和解决方案提供指导。
API 错误
下表列出了 API 错误代码及其说明。
HTTP 错误代码 | 规范错误代码 | 原因 | 示例 | 解决方案 |
---|---|---|---|---|
400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
请求未通过 API 验证,或者您尝试访问需要列入许可名单或被组织政策禁止的模型。 | 请求超出模型的输入词元上限。 | 如需了解请求参数、词元数和其他参数,请参阅适用于生成式 AI 的模型 API 参考文档。 |
403 | PERMISSION_DENIED |
客户端没有足够的权限来调用 API。 | 服务账号无权访问托管图片或视频资源的 Cloud Storage 存储桶。 | 1. 验证是否已启用所有必要的 API,并且服务账号是否拥有访问所选 Vertex AI 服务的权限。 2. Vertex AI 产品和项目专属服务账号 (P4SA) 被授予所需权限,可访问输入中引用的资源。 |
404 | NOT_FOUND |
未在指定网址中找到任何有效对象。 | 未在存储网址中找到图片文件。 | 检查并修复文件位置。 |
429 | RESOURCE_EXHAUSTED |
根据错误消息,此错误可能由以下原因引起: 1. API 配额超出限制。 2. 由于共享服务器容量而发生服务器过载。 |
Gemini API 超出每分钟请求数上限。 | 1. 查看 Vertex AI 生成式 AI 配额限制。如果需要,请申请更高的配额。 2. 请在几秒钟后重试。如果错误在长时间(数小时)后仍然存在,请与 Vertex AI 支持团队联系。 |
499 | CANCELLED |
请求被客户端取消。 | ||
500 | UNKNOWN / INTERNAL |
由于过载或依赖项失败而发生服务器错误。 | 由于服务暂时过载,因此请求受到限制。 | 请在几秒钟后重试。如果错误在长时间(数小时)后仍然存在,请与 Vertex AI 支持团队联系。 |
503 | UNAVAILABLE |
暂时无法使用服务。 | 服务器未响应传入请求。 | 不可用状态可能是暂时的。但是,如果错误仍然存在,请与 Vertex AI 支持团队联系。 |
504 | DEADLINE_EXCEEDED |
客户端设置的截止时限比服务器的默认截止时限(10 分钟)短,请求未在客户端提供的截止时限内完成。 | 考虑延长客户提供的截止时限。 |
处理错误
避免流量高峰。高峰是指在很短的时间内请求数量突然大幅度增加。有时,流量高峰可能会导致配额强制执行问题,并可能会增加服务器过载的可能性。
重试事件时请务必小心。建议您最多重试两次。最短延迟时间为 1 秒,延迟时间会随着后续请求以指数方式增加。
后续步骤
- Generative AI on Vertex AI 存在一些限制。如需了解详情,请参阅 PaLM API 限制。
- 使用 Vertex AI Studio 或 Vertex AI API 尝试学习快速入门教程。
- 探索 Model Garden 中的预训练模型。
- 了解配额和限制。
- 了解价格。