Erros de API de inferência da IA generativa na Vertex AI

Neste guia, apresentamos uma lista de erros que podem ser encontrados ao usar a referência da API do modelo para IA generativa. Os erros seguem o modelo de erros da API do Google Cloud, que recomenda fornecer orientação sobre as causas e as soluções específicas para os modelos de IA generativa.

Erros da API

Esta tabela apresenta códigos de erro da API e descrições.

Código de erro HTTP Código de erro canônico Causa Exemplo Solução
400 INVALID_ARGUMENT / FAILED_PRECONDITION A solicitação falhou na validação da API, ou você tentou acessar um modelo que requer uma lista de permissões, ou não é permitido pela política da organização. A solicitação excede o limite de tokens de entrada do modelo. Consulte a Referência da API do modelo para IA generativa para ver os parâmetros da solicitação, contagem de tokens e outros parâmetros.
403 PERMISSION_DENIED O cliente não tem permissão suficiente para chamar a API. A conta de serviço não tem permissão para acessar o bucket do Cloud Storage que hospeda os recursos de imagem ou vídeo. 1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a permissão correta para acessar o serviço da Vertex AI selecionado.

2. A conta de serviço por produto e por projeto (P4SA) da Vertex AI tem a permissão necessária para acessar os recursos referenciados na entrada.
404 NOT_FOUND Nenhum objeto válido foi encontrado no URL designado. O arquivo de imagem não foi encontrado no URL de armazenamento. Verifique e corrija o local do arquivo.
429 RESOURCE_EXHAUSTED Dependendo da mensagem de erro, o erro pode ter as seguintes causas:

1. A cota da API está acima do limite.

2. Sobrecarga do servidor devido à capacidade compartilhada.
A API Gemini excedeu o limite de solicitações por minuto. 1. Confira os limites de cota da IA generativa da Vertex AI. Se necessário, solicite uma cota maior.

2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), entre em contato com o suporte da Vertex AI.
499 CANCELLED A solicitação foi cancelada pelo cliente.
500 UNKNOWN / INTERNAL Erro de servidor devido a sobrecarga ou falha de dependência. A solicitação está limitada porque o serviço está temporariamente sobrecarregado. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), entre em contato com o suporte da Vertex AI.
503 UNAVAILABLE O serviço está temporariamente indisponível. O servidor não está respondendo às solicitações recebidas. O status indisponível pode ser temporário. No entanto, se o erro persistir, entre em contato com o suporte da Vertex AI.
504 DEADLINE_EXCEEDED O cliente definiu um prazo menor que o prazo padrão do servidor (10 minutos), e a solicitação não foi concluída dentro do prazo fornecido pelo cliente. Considere aumentar o prazo fornecido pelo cliente.

Tratar erros

Evite picos de tráfego. Picos são aumentos repentinos e significativos no número de solicitações em um período muito curto. Às vezes, picos de tráfego podem causar problemas na aplicação da cota e aumentar a chance de sobrecarga do servidor.

Tenha cuidado ao tentar novamente um evento. Recomendamos tentar novamente no máximo duas vezes. O atraso mínimo é de um segundo, com as solicitações subsequentes fazendo backup exponencial.

A seguir