Esta página foi traduzida pela API Cloud Translation.

Erros de API de inferência da IA generativa na Vertex AI

Neste guia, apresentamos uma lista de erros que podem ser encontrados ao usar a referência da API do modelo para IA generativa. Os erros seguem o modelo de erros da API Google Cloud , que recomenda fornecer orientação sobre as causas e as soluções específicas para os modelos de IA generativa.

Erros da API

Esta tabela apresenta códigos de erro da API e descrições.

Código de erro HTTP	Código de erro canônico	Causa	Exemplo	Solução
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	A solicitação falhou na validação da API, ou você tentou acessar um modelo que requer uma lista de permissões, ou não é permitido pela política da organização.	A solicitação excede o limite de tokens de entrada do modelo.	Consulte a Referência da API do modelo para IA generativa para ver os parâmetros da solicitação, contagem de tokens e outros parâmetros.
403	`PERMISSION_DENIED`	O cliente não tem permissão suficiente para chamar a API.	A conta de serviço não tem permissão para acessar o bucket do Cloud Storage que hospeda os recursos de imagem ou vídeo.	1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a permissão correta para acessar o serviço da Vertex AI selecionado. 2. A conta de serviço por produto e por projeto (P4SA) da Vertex AI tem a permissão necessária para acessar os recursos referenciados na entrada.
404	`NOT_FOUND`	Nenhum objeto válido foi encontrado no URL designado.	O arquivo de imagem não foi encontrado no URL de armazenamento.	Verifique e corrija o local do arquivo.
429	`RESOURCE_EXHAUSTED`	Dependendo da mensagem de erro, o erro pode ter as seguintes causas: 1. A cota da API está acima do limite. 2. Sobrecarga do servidor devido à capacidade compartilhada. 3. Você atingiu o limite diário de solicitações usando `logprobs`.	A API Gemini excedeu o limite de solicitações por minuto.	1. Confira os limites de cota da IA generativa da Vertex AI. Se necessário, solicite uma cota maior. 2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), entre em contato com o suporte da Vertex AI. 3. Considere comprar a capacidade de processamento provisionada.
499	`CANCELLED`	A solicitação foi cancelada pelo cliente.
500	`UNKNOWN / INTERNAL`	Erro de servidor devido a sobrecarga ou falha de dependência.	A solicitação está limitada porque o serviço está temporariamente sobrecarregado.	Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), entre em contato com o suporte da Vertex AI.
503	`UNAVAILABLE`	O serviço está temporariamente indisponível.	O servidor não está respondendo às solicitações recebidas.	O status indisponível pode ser temporário. No entanto, se o erro persistir, entre em contato com o suporte da Vertex AI.
504	`DEADLINE_EXCEEDED`	O cliente definiu um prazo menor que o prazo padrão do servidor (10 minutos), e a solicitação não foi concluída dentro do prazo fornecido pelo cliente.	Considere aumentar o prazo fornecido pelo cliente.

Tratar erros

Evite picos de tráfego. Picos são aumentos repentinos e significativos no número de solicitações em um período muito curto. Às vezes, picos de tráfego podem causar problemas na aplicação da cota e aumentar a chance de sobrecarga do servidor.

Tenha cuidado ao tentar novamente um evento. Recomendamos tentar novamente no máximo duas vezes. O atraso mínimo é de um segundo, com as solicitações subsequentes fazendo backup exponencial.

A seguir

A IA generativa na Vertex AI tem algumas limitações. Para saber mais, consulte as Limitações da API PaLM.
Confira um tutorial de início rápido usando o Vertex AI Studio ou a API Vertex AI.
Confira modelos pré-treinados no Model Garden.
Saiba mais sobre cotas e limites.
Saiba mais sobre Preços.