Modes de défaillance

Un mode d'échec est un état d'application incorrect qui déclenche une alerte. L'application doit se remettre d'un mode d'échec pour s'exécuter correctement. Par exemple, le système déclenche une alerte lorsque les API pré-entraînées par IA ne sont pas prêtes à être utilisées et dépassent la limite de temps d'activation désignée. Si un mode d'échec se produit et que l'application ne peut pas récupérer, contactez votre opérateur d'infrastructure pour obtenir de l'aide.

Les modes de défaillance (MD) suivants peuvent se produire et déclencher une alerte :

Échecs de préparation du service

Les échecs de préparation du service se produisent en raison de l'un des FM suivants :

  • FM1 – Impossible de planifier des charges de travail : une ou plusieurs charges de travail du service d'IA ne peuvent pas être planifiées en raison d'un manque de ressources telles que le GPU, la mémoire ou d'une autre erreur.
  • FM3 – Impossible de configurer les composants : l'un des composants requis d'un service d'IA ne peut pas être configuré ni créé en raison d'autorisations incorrectes ou d'autres problèmes. Ces composants sont, par exemple, DNS ou Ingress.
  • FM4 – Les services n'atteignent pas l'état Enabled : les services pré-entraînés ne peuvent pas devenir prêts après avoir déclenché le processus d'activation. La page affiche l'état Enabling pour un ou plusieurs services et, éventuellement, l'infrastructure d'IA sans passer à l'état Enabled.

Échecs de l'interface utilisateur

Les échecs de l'interface utilisateur se produisent en raison de l'un des FM suivants :

  • Échec de la communication entre le frontend et le backend : la page affiche un message d'erreur indiquant des problèmes de communication avec le backend. Les entrées du journal des erreurs comportent des codes allant de AIPL0500 à AIPL0502.
  • Les points de terminaison de l'API de service ne s'affichent pas sur la page : en cas d'erreur, le message Unable to fetch the endpoint s'affiche à la place du point de terminaison.