Neste guia, apresentamos uma lista de erros que podem ser encontrados ao usar a referência da API do modelo para IA generativa. Os erros seguem o modelo de erros da API Google Cloud , que recomenda fornecer orientação sobre as causas e as soluções específicas para os modelos de IA generativa.
Erros da API
Esta tabela apresenta códigos de erro da API e descrições.
| Código de erro HTTP | Código de erro canônico | Causa | Exemplo | Solução | 
|---|---|---|---|---|
| 400 | INVALID_ARGUMENT / FAILED_PRECONDITION | 
A solicitação falhou na validação da API, ou você tentou acessar um modelo que requer uma lista de permissões, ou não é permitido pela política da organização. | A solicitação excede o limite de tokens de entrada do modelo. | Consulte a Referência da API do modelo para IA generativa para ver os parâmetros da solicitação, contagem de tokens e outros parâmetros. | 
| 403 | PERMISSION_DENIED | 
O cliente não tem permissão suficiente para chamar a API. | A conta de serviço não tem permissão para acessar o bucket do Cloud Storage que hospeda os recursos de imagem ou vídeo. | 1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a permissão correta para acessar o serviço da Vertex AI selecionado. 2. A conta de serviço por produto e por projeto (P4SA) da Vertex AI tem a permissão necessária para acessar os recursos referenciados na entrada.  | 
| 404 | NOT_FOUND | 
Nenhum objeto válido foi encontrado no URL designado. | O arquivo de imagem não foi encontrado no URL de armazenamento. | Verifique e corrija o local do arquivo. | 
| 429 | RESOURCE_EXHAUSTED | 
Dependendo da mensagem de erro, o erro pode ter as seguintes causas: 1. A cota da API está acima do limite. 2. Sobrecarga do servidor devido à capacidade compartilhada. 3. Você atingiu o limite diário de solicitações usando logprobs. | 
A API Gemini excedeu o limite de solicitações por minuto. | 1. Confira os limites de cota da IA generativa da Vertex AI. Se necessário, solicite uma cota maior. 2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), entre em contato com o suporte da Vertex AI. 3. Considere comprar a capacidade de processamento provisionada.  | 
| 499 | CANCELLED | 
A solicitação foi cancelada pelo cliente. | ||
| 500 | UNKNOWN / INTERNAL | 
Erro de servidor devido a sobrecarga ou falha de dependência. | A solicitação está limitada porque o serviço está temporariamente sobrecarregado. | Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), entre em contato com o suporte da Vertex AI. | 
| 503 | UNAVAILABLE | 
O serviço está temporariamente indisponível. | O servidor não está respondendo às solicitações recebidas. | O status indisponível pode ser temporário. No entanto, se o erro persistir, entre em contato com o suporte da Vertex AI. | 
| 504 | DEADLINE_EXCEEDED | 
O cliente definiu um prazo menor que o prazo padrão do servidor (10 minutos), e a solicitação não foi concluída dentro do prazo fornecido pelo cliente. | Considere aumentar o prazo fornecido pelo cliente. | 
Tratar erros
Evite picos de tráfego. Picos são aumentos repentinos e significativos no número de solicitações em um período muito curto. Às vezes, picos de tráfego podem causar problemas na aplicação da cota e aumentar a chance de sobrecarga do servidor.
Tenha cuidado ao tentar novamente um evento. Recomendamos tentar novamente no máximo duas vezes. O atraso mínimo é de um segundo, com as solicitações subsequentes fazendo backup exponencial.
A seguir
- A IA generativa na Vertex AI tem algumas limitações. Para saber mais, consulte as Limitações da API PaLM.
 - Confira um tutorial de início rápido usando o Vertex AI Studio ou a API Vertex AI.
 - Confira modelos pré-treinados no Model Garden.
 - Saiba mais sobre cotas e limites.
 - Saiba mais sobre Preços.