Errori dell'IA generativa su Vertex AI Inference API

Questa guida fornisce un elenco di errori che potresti riscontrare utilizzando il riferimento dell'API Model per l'IA generativa. Gli errori seguono il modello di errore dell'API Google Cloud, che consiglia di fornire indicazioni sulle cause e sulle soluzioni specifiche dei modelli di AI generativa.

Errori relativi all'API

Questa tabella fornisce i codici di errore e le descrizioni delle API.

Codice di errore HTTP Codice di errore canonico Causa Esempio Soluzione
400 INVALID_ARGUMENT / FAILED_PRECONDITION La richiesta non supera la convalida dell'API o hai tentato di accedere a un modello che richiede l'inserimento nella lista consentita o non è consentito dai criteri dell'organizzazione. La richiesta supera il limite di token di input del modello. Consulta il riferimento dell'API Model per l'AI generativa per i parametri della richiesta, il conteggio dei token e altri parametri.
403 PERMISSION_DENIED Il client non dispone di autorizzazioni sufficienti per chiamare l'API. L'account di servizio non dispone dell'autorizzazione per accedere al bucket Cloud Storage che ospita risorse di immagini o video. 1. Verifica che tutte le API necessarie siano abilitate e che l'account di servizio disponga dell'autorizzazione corretta per accedere al servizio Vertex AI selezionato.

2. All'account di servizio Vertex AI per prodotto e per progetto (P4SA) viene concessa l'autorizzazione necessaria per accedere alle risorse a cui viene fatto riferimento nell'input.
404 NOT_FOUND Nessun oggetto valido trovato nell'URL designato. File immagine non trovato nell'URL dello spazio di archiviazione. Controlla e correggi il percorso del file.
429 RESOURCE_EXHAUSTED A seconda del messaggio, l'errore potrebbe essere causato da quanto segue:

1. Quota API oltre il limite.

2. Sovraccarico del server dovuto alla capacità del server condiviso.
L'API Gemini supera il limite di richieste al minuto. 1. Controlla i limiti di quota dell'AI generativa di Vertex AI. Se necessario, richiedi una quota più alta.

2. Riprova tra qualche secondo. Se l'errore persiste dopo un periodo di tempo prolungato (ore), contatta l'assistenza Vertex AI.
499 CANCELLED La richiesta è stata annullata dal client.
500 UNKNOWN / INTERNAL Errore del server dovuto a un sovraccarico o a un errore delle dipendenze. La richiesta è limitata perché il servizio è temporaneamente sovraccarico. Riprova tra qualche secondo. Se l'errore persiste dopo un periodo di tempo prolungato (ore), contatta l'assistenza Vertex AI.
503 UNAVAILABLE Il servizio non è al momento disponibile. Il server non risponde alle richieste in entrata. Lo stato non disponibile potrebbe essere temporaneo. Tuttavia, se l'errore persiste, contatta l'assistenza di Vertex AI.
504 DEADLINE_EXCEEDED Il client imposta una scadenza più breve di quella predefinita del server (10 minuti) e la richiesta non è stata completata entro la scadenza fornita dal client. Valuta la possibilità di aumentare la scadenza fornita dal cliente.

Gestire gli errori

Evita picchi di traffico. I picchi sono aumenti improvvisi e significativi del numero di richieste in un periodo di tempo molto breve. A volte i picchi di traffico potrebbero causare problemi per l'applicazione delle quote e aumentare la possibilità di sovraccarico del server.

Fai attenzione quando riprova a un evento. Ti consigliamo di riprovare non più di due volte. Il ritardo minimo è di un secondo e il backup delle richieste successive è esponenziale.

Passaggi successivi