Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Ein Fehlermodus ist ein falscher Anwendungsstatus, der eine Benachrichtigung auslöst. Die Anwendung muss sich von einem Fehlerzustand erholen, damit sie erfolgreich ausgeführt werden kann. Das System gibt beispielsweise eine Benachrichtigung aus, wenn die vortrainierten KI-APIs nicht einsatzbereit sind und das festgelegte Zeitlimit für die Aktivierung überschritten wird. Wenn ein Fehler auftritt und die Anwendung nicht wiederhergestellt werden kann, wenden Sie sich an Ihren Infrastrukturbetreiber.
Die folgenden Fehlermodi (FMs) können auftreten und eine Benachrichtigung auslösen:
Die Fehler bei der Dienstbereitschaft treten aufgrund eines der folgenden FMs auf:
FM1 – Arbeitslasten können nicht geplant werden: Eine oder mehrere Arbeitslasten des KI-Dienstes können aufgrund fehlender Ressourcen wie GPU, Arbeitsspeicher oder eines anderen Fehlers nicht geplant werden.
FM3 – Komponenten können nicht konfiguriert werden: Eine der erforderlichen Komponenten eines KI-Dienstes kann aufgrund falscher Berechtigungen oder anderer Probleme nicht konfiguriert oder erstellt werden. Das sind beispielsweise DNS oder Ingress.
FM4 – Dienste erreichen den Status Enabled nicht: Die vortrainierten Dienste können nach dem Auslösen des Aktivierungsprozesses nicht bereit sein. Auf der Seite wird der Enabling-Status für einen oder mehrere Dienste und möglicherweise die KI-Infrastruktur angezeigt, ohne dass sich der Status in Enabled ändert.
Fehler auf der Benutzeroberfläche
Die Fehler auf der Benutzeroberfläche treten aufgrund eines der folgenden FMs auf:
Fehler bei der Kommunikation zwischen Frontend und Backend: Auf der Seite wird eine Fehlermeldung mit Problemen bei der Backend-Kommunikation angezeigt. Fehlerprotokolleinträge haben Codes von AIPL0500 bis AIPL0502.
Dienst-API-Endpunkte werden auf der Seite nicht angezeigt: Wenn ein Fehler auftritt, wird auf der Seite anstelle des Endpunkts die Meldung Unable to fetch the endpoint angezeigt.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[[["\u003cp\u003eFailure modes are incorrect application states that trigger alerts, and the application must recover from these states to function properly.\u003c/p\u003e\n"],["\u003cp\u003eService readiness failures can occur when AI service workloads cannot be scheduled or configured, or when pre-trained services fail to reach the \u003ccode\u003eEnabled\u003c/code\u003e status.\u003c/p\u003e\n"],["\u003cp\u003eUser interface failures manifest as communication problems between the frontend and backend, or when service API endpoints fail to be displayed.\u003c/p\u003e\n"],["\u003cp\u003eThe three potential failure modes that may trigger an alert are related to the service readiness, AI data-plane runtime, or the user interface.\u003c/p\u003e\n"]]],[],null,["# Failure modes\n\nA failure mode is an incorrect application state that prompts an alert. The application must recover from a failure mode to run successfully. For example, the system prompts an alert when the AI pre-trained APIs aren't ready for use and exceed the designated enable time limit. If a failure mode occurs and the application cannot recover, contact your Infrastructure Operator for help.\n\nThe following failure modes (FMs) might occur and prompt an alert:\n\n- [Service readiness failures](#service-readiness-failures)\n- [AI data-plane runtime failures](#ai-data-plane-runtime-failures)\n- [User interface failures](#user-interface-failures)\n\n### Service readiness failures\n\nThe service readiness failures occur because of one of the following FMs:\n\n- **FM1 - Unable to schedule workloads**: One or more of the AI service workloads cannot be scheduled due to the lack of resources such as GPU, memory, or some other error.\n- **FM3 - Unable to configure components**: One of the required components of an AI service cannot be configured or created because of incorrect permissions or other issues. Those components are, for example, DNS or Ingress.\n- **FM4 - Services not reaching the `Enabled` status** : The pre-trained services cannot become ready after prompting the enablement process. The page displays the `Enabling` status for one or more services and, possibly, the AI infrastructure without changing to the `Enabled` status.\n\n### User interface failures\n\nThe user interface failures occur because of one of the following FMs:\n\n- **Frontend and backend communication failure** : The page displays an error message showing issues with backend communication. Error log entries have codes from `AIPL0500` to `AIPL0502`.\n- **Service API endpoints aren't displayed on the page** : If there is an error, the page shows the `Unable to fetch the endpoint` message instead of the endpoint."]]