Dieser Leitfaden enthält eine Liste der Fehler, die bei der Verwendung der Modell API-Referenz für generative KI auftreten können. Die Fehler folgen dem Fehlermodell der Google Cloud API, das empfiehlt, dass wir Anleitungen zu den Ursachen und Lösungen speziell für die Modelle basierend auf generativer KI bereitstellen.
API-Fehler
Diese Tabelle enthält API-Fehlercodes und -Beschreibungen.
HTTP-Fehlercode | Kanonischer Fehlercode | Ursache | Beispiel | Lösung |
---|---|---|---|---|
400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
Die Anfrage schlägt für die API-Validierung fehl oder Sie haben versucht, auf ein Modell zuzugreifen, das eine Zulassungsliste erfordert oder von der Organisationsrichtlinie nicht zugelassen ist. | Die Anfrage überschreitet das Eingabetokenlimit des Modells. | Weitere Informationen zu Anfrageparametern, Tokenanzahl und anderen Parametern finden Sie in der Modell API-Referenz für generative KI. |
403 | PERMISSION_DENIED |
Der Client hat keine ausreichende Berechtigung zum Aufrufen der API. | Das Dienstkonto ist nicht berechtigt, auf den Cloud Storage-Bucket zuzugreifen, der Bild- oder Videoressourcen hostet. | 1. Prüfen Sie, ob alle erforderlichen APIs aktiviert sind und das Dienstkonto die erforderliche Berechtigung für den Zugriff auf den ausgewählten Vertex AI-Dienst hat. 2. Das produkt- und projektspezifische Vertex AI-Dienstkonto (P4SA) erhält die erforderliche Berechtigung für den Zugriff auf Ressourcen, auf die in der Eingabe verwiesen wird. |
404 | NOT_FOUND |
Unter der angegebenen URL wurde kein gültiges Objekt gefunden. | Image-Datei nicht in der Speicher-URL gefunden. | Prüfen und korrigieren Sie den Speicherort der Datei. |
429 | RESOURCE_EXHAUSTED |
Je nach Fehlermeldung kann der Fehler folgende Ursachen haben: 1. API-Kontingent über dem Limit. 2. Serverüberlastung aufgrund gemeinsam genutzter Serverkapazität. |
Die Gemini API überschreitet das Limit für Anfragen pro Minute. | 1. Prüfen Sie die Kontingentlimits für Vertex AI Generative AI. Beantragen Sie bei Bedarf ein höheres Kontingent. 2. Versuchen Sie es nach einigen Sekunden noch einmal. Wenn der Fehler nach einem längeren Zeitraum (Stunden) weiterhin besteht, wenden Sie sich an den Vertex AI-Support. |
499 | CANCELLED |
Die Anfrage wird vom Client abgebrochen. | ||
500 | UNKNOWN / INTERNAL |
Serverfehler aufgrund von Überlastung oder Abhängigkeitsfehlern. | Die Anfrage wird gedrosselt, da der Dienst vorübergehend überlastet ist. | Versuchen Sie es nach einigen Sekunden noch einmal. Wenn der Fehler nach einem längeren Zeitraum (Stunden) weiterhin besteht, wenden Sie sich an den Vertex AI-Support. |
503 | UNAVAILABLE |
Der Dienst ist vorübergehend nicht verfügbar. | Der Server reagiert nicht auf die eingehenden Anfragen. | Der Status „Nicht verfügbar“ ist möglicherweise nur vorübergehend. Wenn der Fehler jedoch weiterhin besteht, wenden Sie sich an den Vertex AI-Support. |
504 | DEADLINE_EXCEEDED |
Der Client legt eine Frist fest, die kürzer als die Standardfrist des Servers (10 Minuten) ist, und die Anfrage wurde nicht innerhalb der vom Client bereitgestellten Frist abgeschlossen. | Ziehen Sie in Betracht, die vom Kunden bereitgestellte Frist zu erhöhen. |
Fehler verarbeiten
Vermeiden Sie Trafficspitzen. Spitzen sind plötzliche und erhebliche Erhöhungen der Anzahl der Anfragen innerhalb eines sehr kurzen Zeitraums. Manchmal können Trafficspitzen zu Problemen bei der Kontingenterzwingung führen und das Risiko einer Serverüberlastung erhöhen.
Seien Sie vorsichtig beim Wiederholen eines Ereignisses. Wir empfehlen, Wiederholungen nicht mehr als zweimal auszuführen. Die Mindestverzögerung beträgt eine Sekunde, wobei nachfolgende Anfragen sich exponentiell anstauen.
Nächste Schritte
- Für die generative KI für Vertex AI gelten einige Einschränkungen. Weitere Informationen finden Sie unter PaLM API-Einschränkungen.
- Wagen Sie sich an eine Kurzeinführung mit Vertex AI Studio oder der Vertex AI API.
- Vortrainierte Modelle in Model Garden untersuchen.
- Informationen zu Kontingenten und Limits
- Informationen zu Preisen.