Ce guide fournit une liste d'erreurs que vous pouvez rencontrer en utilisant la documentation de référence de l'API de modèle pour l'IA générative. Les erreurs suivent le modèle d'erreur de l'API Google Cloud, qui nous recommande de fournir des conseils sur les causes possibles et sur les solutions spécifiques aux modèles d'IA générative.
Erreurs d'API
Ce tableau fournit les codes et descriptions d'erreur de l'API.
Code d'erreur HTTP | Code d'erreur canonique | Cause | Exemple | Solution |
---|---|---|---|---|
400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
La requête échoue à la validation de l'API, ou vous avez tenté d'accéder à un modèle qui nécessite une liste d'autorisation ou qui n'est pas autorisé par la règle de l'organisation. | La requête dépasse la limite de jetons d'entrée du modèle. | Pour en savoir plus sur les paramètres de requête, le nombre de jetons et d'autres paramètres, consultez la documentation de référence de l'API du modèle pour l'IA générative. |
403 | PERMISSION_DENIED |
Le client ne dispose pas des autorisations nécessaires pour appeler l'API. | Le compte de service n'est pas autorisé à accéder au bucket Cloud Storage hébergeant des ressources d'image ou de vidéo. | 1. Vérifiez que toutes les API nécessaires sont activées et que le compte de service dispose des autorisations appropriées pour accéder au service Vertex AI sélectionné. 2. Le compte de service Vertex AI par produit et par projet (P4SA) dispose de l'autorisation nécessaire pour accéder aux ressources référencées dans l'entrée. |
404 | NOT_FOUND |
Aucun objet valide n'est trouvé à partir de l'URL désignée. | Fichier image introuvable dans l'URL de stockage. | Vérifiez l'emplacement du fichier et effectuez les corrections nécessaires. |
429 | RESOURCE_EXHAUSTED |
Selon le message d'erreur, le problème peut être dû aux éléments suivants : 1. Le quota d'API dépasse la limite. 2. Une surcharge du serveur en raison de la capacité du serveur partagé. |
L'API Gemini dépasse la limite de requêtes par minute. | 1. Vérifiez les limites de quota de l'IA générative sur Vertex AI. Si nécessaire, demandez un quota plus élevé. 2. Réessayez après quelques secondes. Si l'erreur persiste après une période prolongée (heures), contactez l'assistance Vertex AI. |
499 | CANCELLED |
La demande est annulée par le client. | ||
500 | UNKNOWN / INTERNAL |
Erreur du serveur due à une surcharge ou à une défaillance de dépendance. | La requête est limitée, car le service est temporairement surchargé. | Réessayez après quelques secondes. Si l'erreur persiste après une période prolongée (heures), contactez l'assistance Vertex AI. |
503 | UNAVAILABLE |
Le service est momentanément indisponible. | Le serveur ne répond pas aux requêtes entrantes. | L'état d'indisponibilité peut être temporaire. Toutefois, si l'erreur persiste, contactez l'assistance Vertex AI. |
504 | DEADLINE_EXCEEDED |
Le client définit un délai plus court que le délai par défaut du serveur (10 minutes), et la requête ne s'est pas terminée dans le délai fourni par le client. | Envisagez d'augmenter le délai fourni par le client. |
Gérer les erreurs
Évitez les pics de trafic. Les pics sont des augmentations soudaines et significatives du nombre de requêtes sur une très courte période. Parfois, des pics de trafic peuvent entraîner des problèmes d'application des quotas et augmenter les risques de surcharge du serveur.
Veillez à ne pas relancer un événement. Nous vous recommandons de ne pas réessayer plus de deux fois. Le délai minimal est d'une seconde, avec une sauvegarde exponentielle des requêtes suivantes.
Étapes suivantes
- Generative AI sur Vertex AI présente certaines limites. Pour en savoir plus, consultez la section Limites de l'API PaLM.
- Suivez un tutoriel de démarrage rapide sur Vertex AI Studio ou sur l'API Vertex AI.
- Découvrez les modèles pré-entraînés dans Model Garden.
- En savoir plus sur les quotas et limites.
- En savoir plus sur les tarifs.