Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Un mode d'échec est un état d'application incorrect qui déclenche une alerte. L'application doit se remettre d'un mode d'échec pour s'exécuter correctement. Par exemple, le système déclenche une alerte lorsque les API pré-entraînées par IA ne sont pas prêtes à être utilisées et dépassent la limite de temps d'activation désignée. Si un mode d'échec se produit et que l'application ne peut pas récupérer, contactez votre opérateur d'infrastructure pour obtenir de l'aide.
Les modes de défaillance (MD) suivants peuvent se produire et déclencher une alerte :
Les échecs de préparation du service se produisent en raison de l'un des FM suivants :
FM1 – Impossible de planifier des charges de travail : une ou plusieurs charges de travail du service d'IA ne peuvent pas être planifiées en raison d'un manque de ressources telles que le GPU, la mémoire ou d'une autre erreur.
FM3 – Impossible de configurer les composants : l'un des composants requis d'un service d'IA ne peut pas être configuré ni créé en raison d'autorisations incorrectes ou d'autres problèmes. Ces composants sont, par exemple, DNS ou Ingress.
FM4 – Les services n'atteignent pas l'état Enabled : les services pré-entraînés ne peuvent pas devenir prêts après avoir déclenché le processus d'activation. La page affiche l'état Enabling pour un ou plusieurs services et, éventuellement, l'infrastructure d'IA sans passer à l'état Enabled.
Échecs de l'interface utilisateur
Les échecs de l'interface utilisateur se produisent en raison de l'un des FM suivants :
Échec de la communication entre le frontend et le backend : la page affiche un message d'erreur indiquant des problèmes de communication avec le backend. Les entrées du journal des erreurs comportent des codes allant de AIPL0500 à AIPL0502.
Les points de terminaison de l'API de service ne s'affichent pas sur la page : en cas d'erreur, le message Unable to fetch the endpoint s'affiche à la place du point de terminaison.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eFailure modes are incorrect application states that trigger alerts, and the application must recover from these states to function properly.\u003c/p\u003e\n"],["\u003cp\u003eService readiness failures can occur when AI service workloads cannot be scheduled or configured, or when pre-trained services fail to reach the \u003ccode\u003eEnabled\u003c/code\u003e status.\u003c/p\u003e\n"],["\u003cp\u003eUser interface failures manifest as communication problems between the frontend and backend, or when service API endpoints fail to be displayed.\u003c/p\u003e\n"],["\u003cp\u003eThe three potential failure modes that may trigger an alert are related to the service readiness, AI data-plane runtime, or the user interface.\u003c/p\u003e\n"]]],[],null,["# Failure modes\n\nA failure mode is an incorrect application state that prompts an alert. The application must recover from a failure mode to run successfully. For example, the system prompts an alert when the AI pre-trained APIs aren't ready for use and exceed the designated enable time limit. If a failure mode occurs and the application cannot recover, contact your Infrastructure Operator for help.\n\nThe following failure modes (FMs) might occur and prompt an alert:\n\n- [Service readiness failures](#service-readiness-failures)\n- [AI data-plane runtime failures](#ai-data-plane-runtime-failures)\n- [User interface failures](#user-interface-failures)\n\n### Service readiness failures\n\nThe service readiness failures occur because of one of the following FMs:\n\n- **FM1 - Unable to schedule workloads**: One or more of the AI service workloads cannot be scheduled due to the lack of resources such as GPU, memory, or some other error.\n- **FM3 - Unable to configure components**: One of the required components of an AI service cannot be configured or created because of incorrect permissions or other issues. Those components are, for example, DNS or Ingress.\n- **FM4 - Services not reaching the `Enabled` status** : The pre-trained services cannot become ready after prompting the enablement process. The page displays the `Enabling` status for one or more services and, possibly, the AI infrastructure without changing to the `Enabled` status.\n\n### User interface failures\n\nThe user interface failures occur because of one of the following FMs:\n\n- **Frontend and backend communication failure** : The page displays an error message showing issues with backend communication. Error log entries have codes from `AIPL0500` to `AIPL0502`.\n- **Service API endpoints aren't displayed on the page** : If there is an error, the page shows the `Unable to fetch the endpoint` message instead of the endpoint."]]