Modos de falla

Un modo de falla es un estado incorrecto de la aplicación que genera una alerta. La aplicación debe recuperarse de un modo de falla para ejecutarse correctamente. Por ejemplo, el sistema muestra una alerta cuando las APIs previamente entrenadas por IA no están listas para usarse y superan el límite de tiempo de habilitación designado. Si se produce un modo de falla y la aplicación no se puede recuperar, comunícate con el operador de infraestructura para obtener ayuda.

Pueden producirse los siguientes modos de falla (MF) y generar una alerta:

Fallas de preparación del servicio

Las fallas de preparación del servicio se producen debido a uno de los siguientes FM:

  • FM1: No se pueden programar cargas de trabajo: No se puede programar una o más cargas de trabajo del servicio de IA debido a la falta de recursos, como GPU, memoria o algún otro error.
  • FM3: No se pueden configurar los componentes: No se puede configurar ni crear uno de los componentes necesarios de un servicio de IA debido a permisos incorrectos o a otros problemas. Esos componentes son, por ejemplo, DNS o Ingress.
  • FM4: Los servicios no alcanzan el estado Enabled: Los servicios previamente entrenados no pueden estar listos después de solicitar el proceso de habilitación. En la página, se muestra el estado Enabling de uno o más servicios y, posiblemente, la infraestructura de IA sin cambiar al estado Enabled.

Fallas en la interfaz de usuario

Las fallas en la interfaz de usuario se producen debido a uno de los siguientes FM:

  • Falla en la comunicación entre el frontend y el backend: La página muestra un mensaje de error que indica problemas con la comunicación del backend. Las entradas del registro de errores tienen códigos del AIPL0500 al AIPL0502.
  • Los extremos de la API de servicio no se muestran en la página: Si hay un error, la página muestra el mensaje Unable to fetch the endpoint en lugar del extremo.