Questa guida fornisce un elenco di errori che potresti riscontrare durante l'utilizzo del riferimento all'API Model per l'IA generativa. Gli errori rispettano il modello di errore dell'API Google Cloud , che consiglia di fornire indicazioni sulle cause e sulle soluzioni specifiche per i modelli di IA generativa.
Errori dell'API
Questa tabella fornisce codici e descrizioni degli errori dell'API.
Codice di errore HTTP | Codice di errore canonico | Causa | Esempio | Soluzione |
---|---|---|---|---|
400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
La richiesta non supera la convalida dell'API o hai provato ad accedere a un modello che richiede l'inserimento nella lista consentita o non è consentito dalle norme dell'organizzazione. | La richiesta supera il limite di token di input del modello. | Per i parametri di richiesta, il conteggio dei token e altri parametri, consulta la documentazione di riferimento dell'API Model per l'IA generativa . |
403 | PERMISSION_DENIED |
Il client non dispone di autorizzazioni sufficienti per chiamare l'API. | L'account di servizio non dispone dell'autorizzazione per accedere al bucket Cloud Storage che ospita le risorse video o di immagini. | 1. Verifica che tutte le API necessarie siano abilitate e che l'account di servizio disponga dell'autorizzazione corretta per accedere al servizio Vertex AI selezionato. 2. All'account di servizio per prodotto e progetto (P4SA) di Vertex AI viene concessa l'autorizzazione necessaria per accedere alle risorse a cui viene fatto riferimento nell'input. |
404 | NOT_FOUND |
Non viene trovato alcun oggetto valido dall'URL designato. | File immagine non trovato nell'URL di archiviazione. | Controlla e correggi la posizione del file. |
429 | RESOURCE_EXHAUSTED |
A seconda del messaggio di errore, l'errore potrebbe essere causato da quanto segue: 1. Quota API superiore al limite. 2. Sovraccarico del server a causa della capacità del server condivisa. 3. Hai raggiunto il limite giornaliero di richieste che utilizzano logprobs . |
L'API Gemini supera il limite di richieste al minuto. | 1. Controlla i limiti di quota dell'IA generativa di Vertex AI. Se necessario, richiedi una quota più alta. 2. Riprova dopo qualche secondo. Se l'errore persiste dopo un periodo di tempo prolungato (ore), contatta l'assistenza Vertex AI. |
499 | CANCELLED |
La richiesta viene annullata dal client. | ||
500 | UNKNOWN / INTERNAL |
Errore del server a causa di un sovraccarico o di un errore di dipendenza. | La richiesta è limitata perché il servizio è temporaneamente sovraccarico. | Riprova dopo qualche secondo. Se l'errore persiste dopo un periodo di tempo prolungato (ore), contatta l'assistenza Vertex AI. |
503 | UNAVAILABLE |
Il servizio non è al momento disponibile. | Il server non risponde alle richieste in arrivo. | Lo stato di non disponibilità potrebbe essere temporaneo. Tuttavia, se l'errore persiste, contatta l'assistenza Vertex AI. |
504 | DEADLINE_EXCEEDED |
Il client imposta una scadenza più breve di quella predefinita del server (10 minuti) e la richiesta non è stata completata entro la scadenza indicata dal client. | Valuta la possibilità di aumentare la scadenza indicata dal cliente. |
Gestisci gli errori
Evita i picchi di traffico. Gli picchi sono aumenti improvvisi e significativi del numero di richieste in un periodo di tempo molto breve. A volte, picchi di traffico possono causare problemi per l'applicazione delle quote e aumentare le probabilità di sovraccarico del server.
Fai attenzione a riprovare a eseguire un evento. Ti consigliamo di riprovare non più di due volte. Il ritardo minimo è di un secondo, con le richieste successive che si accumulano in modo exponenciale.
Passaggi successivi
- L'IA generativa su Vertex AI presenta alcune limitazioni. Per saperne di più, consulta Limitazioni dell'API PaLM.
- Prova un tutorial di avvio rapido utilizzando Vertex AI Studio o l'API Vertex AI.
- Esplora i modelli pre-addestrati in Model Garden.
- Scopri di più su quote e limiti.
- Scopri di più sui prezzi.