Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Una modalità di errore è uno stato errato dell'applicazione che genera un avviso. L'applicazione deve ripristinarsi da una modalità di errore per essere eseguita correttamente. Ad esempio, il sistema mostra un avviso quando le API pre-addestrate di AI non sono pronte per l'uso e superano il limite di tempo di attivazione designato. Se si verifica una modalità di errore e l'applicazione non può essere ripristinata, contatta l'operatore dell'infrastruttura per ricevere assistenza.
Potrebbero verificarsi le seguenti modalità di guasto (FM) che attivano un avviso:
Gli errori di preparazione del servizio si verificano a causa di uno dei seguenti FM:
FM1 - Unable to schedule workloads: non è possibile pianificare uno o più carichi di lavoro del servizio AI a causa della mancanza di risorse come GPU, memoria o di un altro errore.
FM3 - Impossibile configurare i componenti: uno dei componenti richiesti di un servizio di AI non può essere configurato o creato a causa di autorizzazioni errate o altri problemi. Questi componenti sono, ad esempio, DNS o Ingress.
FM4 - Servizi che non raggiungono lo stato Enabled: i servizi preaddestrati non possono diventare pronti dopo aver richiesto la procedura di attivazione. La pagina mostra lo stato di Enabling per uno o più servizi e, possibilmente, l'infrastruttura AI senza passare allo stato Enabled.
Errori dell'interfaccia utente
Gli errori dell'interfaccia utente si verificano a causa di uno dei seguenti FM:
Errore di comunicazione tra frontend e backend: nella pagina viene visualizzato un messaggio di errore che indica problemi di comunicazione con il backend. Le voci del log degli errori hanno codici da AIPL0500 a AIPL0502.
Gli endpoint API di servizio non vengono visualizzati nella pagina: se si verifica un errore, la pagina mostra il messaggio Unable to fetch the endpoint anziché l'endpoint.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[[["\u003cp\u003eFailure modes are incorrect application states that trigger alerts, and the application must recover from these states to function properly.\u003c/p\u003e\n"],["\u003cp\u003eService readiness failures can occur when AI service workloads cannot be scheduled or configured, or when pre-trained services fail to reach the \u003ccode\u003eEnabled\u003c/code\u003e status.\u003c/p\u003e\n"],["\u003cp\u003eUser interface failures manifest as communication problems between the frontend and backend, or when service API endpoints fail to be displayed.\u003c/p\u003e\n"],["\u003cp\u003eThe three potential failure modes that may trigger an alert are related to the service readiness, AI data-plane runtime, or the user interface.\u003c/p\u003e\n"]]],[],null,["# Failure modes\n\nA failure mode is an incorrect application state that prompts an alert. The application must recover from a failure mode to run successfully. For example, the system prompts an alert when the AI pre-trained APIs aren't ready for use and exceed the designated enable time limit. If a failure mode occurs and the application cannot recover, contact your Infrastructure Operator for help.\n\nThe following failure modes (FMs) might occur and prompt an alert:\n\n- [Service readiness failures](#service-readiness-failures)\n- [AI data-plane runtime failures](#ai-data-plane-runtime-failures)\n- [User interface failures](#user-interface-failures)\n\n### Service readiness failures\n\nThe service readiness failures occur because of one of the following FMs:\n\n- **FM1 - Unable to schedule workloads**: One or more of the AI service workloads cannot be scheduled due to the lack of resources such as GPU, memory, or some other error.\n- **FM3 - Unable to configure components**: One of the required components of an AI service cannot be configured or created because of incorrect permissions or other issues. Those components are, for example, DNS or Ingress.\n- **FM4 - Services not reaching the `Enabled` status** : The pre-trained services cannot become ready after prompting the enablement process. The page displays the `Enabling` status for one or more services and, possibly, the AI infrastructure without changing to the `Enabled` status.\n\n### User interface failures\n\nThe user interface failures occur because of one of the following FMs:\n\n- **Frontend and backend communication failure** : The page displays an error message showing issues with backend communication. Error log entries have codes from `AIPL0500` to `AIPL0502`.\n- **Service API endpoints aren't displayed on the page** : If there is an error, the page shows the `Unable to fetch the endpoint` message instead of the endpoint."]]