Questa pagina è stata tradotta dall'API Cloud Translation.

Errori dell'API di inferenza dell'IA generativa su Vertex AI

Questa guida fornisce un elenco degli errori che potresti riscontrare durante l'utilizzo dei riferimenti API Model per l'AI generativa. Gli errori seguono il modello di errore dell'API Google Cloud , che consiglia di fornire indicazioni sulle cause e sulle soluzioni specifiche per i modelli di AI generativa.

Errori API

Questa tabella fornisce i codici di errore e le descrizioni delle API.

Codice errore HTTP	Codice di errore canonico	Causa	Esempio	Soluzione
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	La richiesta non supera la convalida dell'API oppure hai tentato di accedere a un modello che richiede l'inserimento nella lista consentita o non è consentito dalla policy dell'organizzazione.	La richiesta supera il limite di token di input del modello.	Per i parametri della richiesta, il conteggio dei token e altri parametri, consulta il riferimento API Model per l'AI generativa .
403	`PERMISSION_DENIED`	Il client non dispone di autorizzazioni sufficienti per chiamare l'API.	Il service account non dispone dell'autorizzazione per accedere al bucket Cloud Storage che ospita risorse di immagini o video.	1. Verifica che tutte le API necessarie siano abilitate e che il account di servizio disponga dell'autorizzazione corretta per accedere al servizio Vertex AI selezionato. 2. Account di servizio per prodotto e per progetto (P4SA) di Vertex AI viene concessa l'autorizzazione necessaria per accedere alle risorse a cui viene fatto riferimento nell'input.
404	`NOT_FOUND`	Nessun oggetto valido trovato nell'URL designato.	Il file immagine non è stato trovato nell'URL di archiviazione.	Controlla e correggi la posizione del file.
429	`RESOURCE_EXHAUSTED`	A seconda del messaggio di errore, l'errore potrebbe essere causato da quanto segue: 1. Quota API oltre il limite. 2. Sovraccarico del server dovuto alla capacità del server condivisa. 3. Hai raggiunto il limite giornaliero di richieste che utilizzano `logprobs`.	L'API Gemini supera il limite di richieste al minuto.	1. Controlla i limiti di quota dell'AI generativa di Vertex AI. Se necessario, richiedi una quota più alta. 2. Riprova tra qualche secondo. Se l'errore persiste per un periodo di tempo prolungato (ore), contatta l'assistenza Vertex AI. 3. Valuta l'acquisto del throughput riservato.
499	`CANCELLED`	La richiesta è stata annullata dal client.
500	`UNKNOWN / INTERNAL`	Errore del server dovuto a sovraccarico o errore di dipendenza.	La richiesta è limitata perché il servizio è temporaneamente sovraccarico.	Riprova tra qualche secondo. Se l'errore persiste dopo un periodo di tempo prolungato (ore), contatta l'assistenza Vertex AI.
503	`UNAVAILABLE`	Il servizio non è al momento disponibile.	Il server non risponde alle richieste in entrata.	Lo stato non disponibile potrebbe essere temporaneo. Tuttavia, se l'errore persiste, contatta l'assistenza Vertex AI.
504	`DEADLINE_EXCEEDED`	Il client imposta una scadenza più breve di quella predefinita del server (10 minuti) e la richiesta non è stata completata entro la scadenza fornita dal client.	Valuta la possibilità di aumentare la scadenza fornita dal cliente.

Gestisci gli errori

Evita i picchi di traffico. I picchi sono aumenti improvvisi e significativi del numero di richieste in un periodo di tempo molto breve. A volte, i picchi di traffico potrebbero causare problemi per l'applicazione delle quote e aumentare la probabilità di sovraccarico del server.

Fai attenzione quando riprovi un evento. Ti consigliamo di riprovare non più di due volte. Il ritardo minimo è di un secondo, mentre le richieste successive aumentano in modo esponenziale.

Passaggi successivi

L'AI generativa su Vertex AI presenta alcune limitazioni. Per saperne di più, consulta Limitazioni dell'API PaLM.
Prova un tutorial di avvio rapido utilizzando Vertex AI Studio o l'API Vertex AI.
Esplora i modelli preaddestrati in Model Garden.
Scopri di più su quote e limiti.
Scopri di più sui prezzi.