Esta página foi traduzida pela API Cloud Translation.

Erros da API de inferência da IA generativa no Vertex AI

Este guia fornece uma lista de erros que pode encontrar ao usar a referência da API Model para IA generativa. Os erros seguem o modelo de erro da API, que recomenda que forneçamos orientações sobre as causas e as soluções específicas dos modelos de IA generativa. Google Cloud

Erros da API

Esta tabela apresenta os códigos de erros e as descrições da API.

Código de erro HTTP	Código de erro canónico	Causa	Exemplo	Solução
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	O pedido falha a validação da API ou tentou aceder a um modelo que requer a inclusão numa lista de autorizações ou que não é permitido pela política da organização.	O pedido excede o limite de tokens de entrada do modelo.	Consulte a referência da API Model para IA generativa para ver os parâmetros de pedido, a contagem de tokens e outros parâmetros.
403	`PERMISSION_DENIED`	O cliente não tem autorização suficiente para chamar a API.	A conta de serviço não tem autorização para aceder ao contentor do Cloud Storage que aloja recursos de imagem ou vídeo.	1. Verifique se todas as APIs necessárias estão ativadas e se a conta de serviço tem a autorização correta para aceder ao serviço Vertex AI selecionado. 2. A conta de serviço por produto e por projeto do Vertex AI (P4SA) recebe a autorização necessária para aceder aos recursos referenciados na entrada.
404	`NOT_FOUND`	Não foi encontrado nenhum objeto válido no URL designado.	Não foi possível encontrar o ficheiro de imagem no URL de armazenamento.	Verifique e corrija a localização do ficheiro.
429	`RESOURCE_EXHAUSTED`	Consoante a mensagem de erro, o erro pode dever-se ao seguinte: 1. Quota da API acima do limite. 2. Sobrecarga do servidor devido à capacidade do servidor partilhada. 3. Atingiu o limite diário de pedidos com `logprobs`.	A API Gemini excede o limite de pedidos por minuto.	1. Verifique os limites de quota da IA generativa do Vertex AI. Se necessário, candidate-se a uma quota mais elevada. 2. Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI. 3. Considere comprar débito aprovisionado.
499	`CANCELLED`	O pedido é cancelado pelo cliente.
500	`UNKNOWN / INTERNAL`	Erro do servidor devido a sobrecarga ou falha de dependência.	O pedido está limitado porque o serviço está temporariamente sobrecarregado.	Tente novamente após alguns segundos. Se o erro persistir após um período prolongado (horas), contacte o apoio técnico do Vertex AI.
503	`UNAVAILABLE`	O serviço está temporariamente indisponível.	O servidor não está a responder aos pedidos recebidos.	O estado de indisponibilidade pode ser temporário. No entanto, se o erro persistir, contacte o apoio técnico da Vertex AI.
504	`DEADLINE_EXCEEDED`	O cliente define um prazo mais curto do que o prazo predefinido do servidor (10 minutos) e o pedido não foi concluído dentro do prazo fornecido pelo cliente.	Pondere aumentar o prazo fornecido pelo cliente.

Processar erros

Evite picos de tráfego. Os picos são aumentos súbitos e significativos no número de pedidos num período muito curto. Por vezes, os picos de tráfego podem causar problemas na aplicação de quotas e aumentar a probabilidade de sobrecarga do servidor.

Tenha cuidado ao tentar novamente um evento. Recomendamos que não tente mais de duas vezes. O atraso mínimo é de um segundo, com os pedidos subsequentes a serem processados de forma exponencial.

O que se segue?

A IA generativa no Vertex AI tem algumas limitações. Para saber mais, consulte as limitações da API PaLM.
Experimente um tutorial de início rápido com o Vertex AI Studio ou a API Vertex AI.
Explore modelos pré-treinados no Model Garden.
Saiba mais sobre as quotas e os limites.
Saiba mais acerca dos preços.