Este guia fornece uma lista de erros que pode encontrar ao usar a referência da API Model para IA generativa. Os erros seguem o modelo de erro da API, que recomenda que forneçamos orientações sobre as causas e as soluções específicas dos modelos de IA generativa. Google Cloud
Erros da API
Esta tabela apresenta os códigos de erros e as descrições da API.
| Código de erro HTTP | Código de erro canónico | Causa | Exemplo | Solução |
|---|---|---|---|---|
| 400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
O pedido falha a validação da API ou tentou aceder a um modelo que requer a inclusão numa lista de autorizações ou que não é permitido pela política da organização. | O pedido excede o limite de tokens de entrada do modelo. | Consulte a referência da API Model para IA generativa para ver os parâmetros de pedido, a contagem de tokens e outros parâmetros. |
| 403 | PERMISSION_DENIED |
O cliente não tem autorização suficiente para chamar a API. | A conta de serviço não tem autorização para aceder ao contentor do Cloud Storage que aloja recursos de imagem ou vídeo. | 1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a autorização correta para aceder ao serviço Vertex AI selecionado. 2. A conta de serviço por produto e por projeto do Vertex AI (P4SA) recebe a autorização necessária para aceder aos recursos referenciados na entrada. |
| 404 | NOT_FOUND |
Não foi encontrado nenhum objeto válido no URL designado. | Não foi possível encontrar o ficheiro de imagem no URL de armazenamento. | Verifique e corrija a localização do ficheiro. |
| 429 | RESOURCE_EXHAUSTED |
Consoante a mensagem de erro, o erro pode dever-se ao seguinte: 1. Quota da API acima do limite. 2. Sobrecarga do servidor devido à capacidade do servidor partilhada. 3. Atingiu o limite diário de pedidos com logprobs. |
A API Gemini excede o limite de pedidos por minuto. | 1. Verifique os limites de quota da IA generativa do Vertex AI. Se necessário, candidate-se a uma quota mais elevada. 2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI. 3. Considere comprar débito aprovisionado. |
| 499 | CANCELLED |
O pedido é cancelado pelo cliente. | ||
| 500 | UNKNOWN / INTERNAL |
Erro do servidor devido a sobrecarga ou falha de dependência. | O pedido está limitado porque o serviço está temporariamente sobrecarregado. | Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI. |
| 503 | UNAVAILABLE |
O serviço está temporariamente indisponível. | O servidor não está a responder aos pedidos recebidos. | O estado de indisponibilidade pode ser temporário. No entanto, se o erro persistir, contacte o apoio técnico da Vertex AI. |
| 504 | DEADLINE_EXCEEDED |
O cliente define um prazo mais curto do que o prazo predefinido do servidor (10 minutos) e o pedido não foi concluído dentro do prazo fornecido pelo cliente. | Pondere aumentar o prazo fornecido pelo cliente. |
Processar erros
Evite picos de tráfego. Os picos são aumentos súbitos e significativos no número de pedidos num período muito curto. Por vezes, os picos de tráfego podem causar problemas na aplicação de quotas e aumentar a probabilidade de sobrecarga do servidor.
Tenha cuidado ao tentar novamente um evento. Recomendamos que não tente mais de duas vezes. O atraso mínimo é de um segundo, com os pedidos subsequentes a serem processados de forma exponencial.
O que se segue?
- A IA generativa no Vertex AI tem algumas limitações. Para saber mais, consulte as limitações da API PaLM.
- Experimente um tutorial de início rápido com o Vertex AI Studio ou a API Vertex AI.
- Explore modelos pré-treinados no Model Garden.
- Saiba mais sobre as quotas e os limites.
- Saiba mais acerca dos preços.