English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

控制台

联系我们免费开始使用吧

Vertex AI 上的生成式 AI 推理 API 错误

本指南提供了您在使用适用于生成式 AI 的模型 API 参考文档时可能会遇到的错误列表。这些错误遵循 Google Cloud API 的错误模型，该模型建议我们针对特定于生成式 AI 模型的原因和解决方案提供指导。

API 错误

下表列出了 API 错误代码及其说明。

HTTP 错误代码	规范错误代码	原因	示例	解决方案
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	请求未通过 API 验证，或者您尝试访问需要列入许可名单或被组织政策禁止的模型。	请求超出模型的输入词元上限。	如需了解请求参数、词元数和其他参数，请参阅适用于生成式 AI 的模型 API 参考文档。
403	`PERMISSION_DENIED`	客户端没有足够的权限来调用 API。	服务账号无权访问托管图片或视频资源的 Cloud Storage 存储桶。	1. 验证是否已启用所有必要的 API，并且服务账号是否拥有访问所选 Vertex AI 服务的权限。 2. Vertex AI 产品和项目专属服务账号 (P4SA) 被授予所需权限，可访问输入中引用的资源。
404	`NOT_FOUND`	未在指定网址中找到任何有效对象。	未在存储网址中找到图片文件。	检查并修复文件位置。
429	`RESOURCE_EXHAUSTED`	根据错误消息，此错误可能由以下原因引起： 1. API 配额超出限制。 2. 由于共享服务器容量而发生服务器过载。 3. 您已达到使用 `logprobs` 的请求的每日上限。	Gemini API 超出每分钟请求数上限。	1. 查看 Vertex AI 生成式 AI 配额限制。如果需要，请申请更高的配额。 2. 请在几秒钟后重试。如果错误在长时间（数小时）后仍然存在，请与 Vertex AI 支持团队联系。 3. 可考虑购买预配吞吐量。
499	`CANCELLED`	请求被客户端取消。
500	`UNKNOWN / INTERNAL`	由于过载或依赖项失败而发生服务器错误。	由于服务暂时过载，因此请求受到限制。	请在几秒钟后重试。如果错误在长时间（数小时）后仍然存在，请与 Vertex AI 支持团队联系。
503	`UNAVAILABLE`	暂时无法使用服务。	服务器未响应传入请求。	不可用状态可能是暂时的。但是，如果错误仍然存在，请与 Vertex AI 支持团队联系。
504	`DEADLINE_EXCEEDED`	客户端设置的截止时限比服务器的默认截止时限（10 分钟）短，请求未在客户端提供的截止时限内完成。	考虑延长客户提供的截止时限。

处理错误

避免流量高峰。高峰是指在很短的时间内请求数量突然大幅度增加。有时，流量高峰可能会导致配额强制执行问题，并可能会增加服务器过载的可能性。

重试事件时请务必小心。建议您最多重试两次。最短延迟时间为 1 秒，延迟时间会随着后续请求以指数方式增加。

后续步骤

Generative AI on Vertex AI 存在一些限制。如需了解详情，请参阅 PaLM API 限制。
使用 Vertex AI Studio 或 Vertex AI API 尝试学习快速入门教程。
探索 Model Garden 中的预训练模型。
了解配额与限制
了解价格。

如未另行说明，那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可，并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情，请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2025-10-19。