Neste guia, apresentamos uma lista de erros que podem ser encontrados ao usar a referência da API do modelo para IA generativa. Os erros seguem o modelo de erros da API do Google Cloud, que recomenda fornecer orientação sobre as causas e as soluções específicas para os modelos de IA generativa.
Erros da API
Esta tabela apresenta códigos de erro da API e descrições.
Código de erro HTTP | Código de erro canônico | Causa | Exemplo | Solução |
---|---|---|---|---|
400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
A solicitação falhou na validação da API, ou você tentou acessar um modelo que requer uma lista de permissões, ou não é permitido pela política da organização. | A solicitação excede o limite de tokens de entrada do modelo. | Consulte a Referência da API do modelo para IA generativa para ver os parâmetros da solicitação, contagem de tokens e outros parâmetros. |
403 | PERMISSION_DENIED |
O cliente não tem permissão suficiente para chamar a API. | A conta de serviço não tem permissão para acessar o bucket do Cloud Storage que hospeda os recursos de imagem ou vídeo. | 1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a permissão correta para acessar o serviço da Vertex AI selecionado. 2. A conta de serviço por produto e por projeto (P4SA) da Vertex AI tem a permissão necessária para acessar os recursos referenciados na entrada. |
404 | NOT_FOUND |
Nenhum objeto válido foi encontrado no URL designado. | O arquivo de imagem não foi encontrado no URL de armazenamento. | Verifique e corrija o local do arquivo. |
429 | RESOURCE_EXHAUSTED |
Dependendo da mensagem de erro, o erro pode ter as seguintes causas: 1. A cota da API está acima do limite. 2. Sobrecarga do servidor devido à capacidade compartilhada. |
A API Gemini excedeu o limite de solicitações por minuto. | 1. Confira os limites de cota da IA generativa da Vertex AI. Se necessário, solicite uma cota maior. 2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), entre em contato com o suporte da Vertex AI. |
499 | CANCELLED |
A solicitação foi cancelada pelo cliente. | ||
500 | UNKNOWN / INTERNAL |
Erro de servidor devido a sobrecarga ou falha de dependência. | A solicitação está limitada porque o serviço está temporariamente sobrecarregado. | Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), entre em contato com o suporte da Vertex AI. |
503 | UNAVAILABLE |
O serviço está temporariamente indisponível. | O servidor não está respondendo às solicitações recebidas. | O status indisponível pode ser temporário. No entanto, se o erro persistir, entre em contato com o suporte da Vertex AI. |
504 | DEADLINE_EXCEEDED |
O cliente definiu um prazo menor que o prazo padrão do servidor (10 minutos), e a solicitação não foi concluída dentro do prazo fornecido pelo cliente. | Considere aumentar o prazo fornecido pelo cliente. |
Tratar erros
Evite picos de tráfego. Picos são aumentos repentinos e significativos no número de solicitações em um período muito curto. Às vezes, picos de tráfego podem causar problemas na aplicação da cota e aumentar a chance de sobrecarga do servidor.
Tenha cuidado ao tentar novamente um evento. Recomendamos tentar novamente no máximo duas vezes. O atraso mínimo é de um segundo, com as solicitações subsequentes fazendo backup exponencial.
A seguir
- A IA generativa na Vertex AI tem algumas limitações. Para saber mais, consulte as Limitações da API PaLM.
- Confira um tutorial de início rápido usando o Vertex AI Studio ou a API Vertex AI.
- Confira modelos pré-treinados no Model Garden.
- Saiba mais sobre cotas e limites.
- Saiba mais sobre Preços.