Erreurs de l'API d'inférence de l'IA générative sur Vertex AI

Ce guide fournit une liste des erreurs que vous pouvez rencontrer en utilisant la documentation de référence de l'API de modèle pour l'IA générative. Les erreurs suivent le modèle d'erreur de l'API Google Cloud, qui recommande de fournir des conseils sur les causes et les solutions spécifiques aux modèles d'IA générative.

Erreurs d'API

Ce tableau fournit des descriptions et des codes d'erreur de l'API.

Code d'erreur HTTP Code d'erreur canonique Cause Exemple Solution
400 INVALID_ARGUMENT / FAILED_PRECONDITION La requête d'API échoue à la validation de l'API, ou vous avez essayé d'accéder à un modèle qui nécessite une liste d'autorisation ou qui n'est pas autorisé par la règle de l'organisation. La requête dépasse la limite de jetons d'entrée du modèle. Consultez la documentation de référence de l'API du modèle pour l'IA générative pour obtenir des informations sur les paramètres de requête, le nombre de jetons et d'autres paramètres.
403 PERMISSION_DENIED Le client ne dispose pas des autorisations nécessaires pour appeler l'API. Le compte de service n'est pas autorisé à accéder au bucket Cloud Storage hébergeant des ressources d'image ou de vidéo. 1. Vérifiez que toutes les API nécessaires sont activées et que le compte de service dispose des autorisations appropriées pour accéder au service Vertex AI sélectionné.

2. Le compte de service Vertex AI par produit et par projet (P4SA) dispose de l'autorisation nécessaire pour accéder aux ressources référencées dans l'entrée.
404 NOT_FOUND Aucun objet valide n'a été trouvé à partir de l'URL désignée. Fichier image introuvable dans l'URL de stockage. Vérifiez l'emplacement du fichier et corrigez-le.
429 RESOURCE_EXHAUSTED Selon le message d'erreur, l'erreur peut être due à l'un des problèmes suivants:

1. Le quota d'API dépasse la limite.

2. Surcharge du serveur en raison d'une capacité partagée sur le serveur.
L'API Gemini dépasse la limite de requêtes par minute. 1. Vérifiez les limites de quota de Vertex AI Generative AI. Si nécessaire, demandez un quota plus élevé.

2. Réessayez après quelques secondes. Si l'erreur persiste après une période prolongée (en heures), contactez l'assistance Vertex AI.
499 CANCELLED La demande est annulée par le client.
500 UNKNOWN / INTERNAL Erreur de serveur due à une surcharge ou à un échec de dépendance. La requête est limitée, car le service est temporairement surchargé. Réessayez après quelques secondes. Si l'erreur persiste après une période prolongée (en heures), contactez l'assistance Vertex AI.
503 UNAVAILABLE Le service est momentanément indisponible. Le serveur ne répond pas aux requêtes entrantes. L'état "Indisponibilité" peut être temporaire. Toutefois, si l'erreur persiste, contactez l'assistance Vertex AI.
504 DEADLINE_EXCEEDED Le client définit un délai plus court que le délai par défaut du serveur (10 minutes), et la requête n'a pas abouti dans le délai fourni par le client. Envisagez d'augmenter le délai fourni par le client.

Gérer les erreurs

Évitez les pics de trafic. Les pics sont des augmentations soudaines et significatives du nombre de requêtes dans un très court laps de temps. Parfois, les pics de trafic peuvent entraîner des problèmes d'application des quotas et augmenter les risques de surcharge du serveur.

Veillez à ne pas relancer un événement. Nous vous recommandons de ne pas réessayer plus de deux fois. Le délai minimal est d'une seconde avec une sauvegarde exponentielle des requêtes suivantes.

Étapes suivantes