Erros da API de inferência da IA generativa no Vertex AI

Este guia fornece uma lista de erros que pode encontrar ao usar a referência da API Model para IA generativa. Os erros seguem o modelo de erro da API, que recomenda que forneçamos orientações sobre as causas e as soluções específicas dos modelos de IA generativa. Google Cloud

Erros da API

Esta tabela apresenta os códigos de erros e as descrições da API.

Código de erro HTTP Código de erro canónico Causa Exemplo Solução
400 INVALID_ARGUMENT / FAILED_PRECONDITION O pedido falha a validação da API ou tentou aceder a um modelo que requer a inclusão numa lista de autorizações ou que não é permitido pela política da organização. O pedido excede o limite de tokens de entrada do modelo. Consulte a referência da API Model para IA generativa para ver os parâmetros de pedido, a contagem de tokens e outros parâmetros.
403 PERMISSION_DENIED O cliente não tem autorização suficiente para chamar a API. A conta de serviço não tem autorização para aceder ao contentor do Cloud Storage que aloja recursos de imagem ou vídeo. 1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a autorização correta para aceder ao serviço Vertex AI selecionado.

2. A conta de serviço por produto e por projeto do Vertex AI (P4SA) recebe a autorização necessária para aceder aos recursos referenciados na entrada.
404 NOT_FOUND Não foi encontrado nenhum objeto válido no URL designado. Não foi possível encontrar o ficheiro de imagem no URL de armazenamento. Verifique e corrija a localização do ficheiro.
429 RESOURCE_EXHAUSTED Consoante a mensagem de erro, o erro pode dever-se ao seguinte:

1. Quota da API acima do limite.

2. Sobrecarga do servidor devido à capacidade do servidor partilhada.

3. Atingiu o limite diário de pedidos com logprobs.
A API Gemini excede o limite de pedidos por minuto. 1. Verifique os limites de quota da IA generativa do Vertex AI. Se necessário, candidate-se a uma quota mais elevada.

2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI.

3. Considere comprar débito aprovisionado.
499 CANCELLED O pedido é cancelado pelo cliente.
500 UNKNOWN / INTERNAL Erro do servidor devido a sobrecarga ou falha de dependência. O pedido está limitado porque o serviço está temporariamente sobrecarregado. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI.
503 UNAVAILABLE O serviço está temporariamente indisponível. O servidor não está a responder aos pedidos recebidos. O estado de indisponibilidade pode ser temporário. No entanto, se o erro persistir, contacte o apoio técnico da Vertex AI.
504 DEADLINE_EXCEEDED O cliente define um prazo mais curto do que o prazo predefinido do servidor (10 minutos) e o pedido não foi concluído dentro do prazo fornecido pelo cliente. Pondere aumentar o prazo fornecido pelo cliente.

Processar erros

Evite picos de tráfego. Os picos são aumentos súbitos e significativos no número de pedidos num período muito curto. Por vezes, os picos de tráfego podem causar problemas na aplicação de quotas e aumentar a probabilidade de sobrecarga do servidor.

Tenha cuidado ao tentar novamente um evento. Recomendamos que não tente mais de duas vezes. O atraso mínimo é de um segundo, com os pedidos subsequentes a serem processados de forma exponencial.

O que se segue?