故障模式

故障模式是指会触发提醒的错误应用状态。应用必须从故障模式中恢复才能成功运行。例如,当 AI 预训练的 API 未准备就绪且超出指定的启用时间限制时,系统会提示提醒。如果出现故障模式且应用无法恢复,请联系您的基础设施运营商寻求帮助。

可能会出现以下故障模式 (FM),并触发提醒:

服务就绪失败

服务就绪失败是由以下某种 FM 造成的:

  • FM1 - 无法调度工作负载:由于缺少 GPU、内存等资源或出现其他错误,一个或多个 AI 服务工作负载无法调度。
  • FM3 - 无法配置组件:由于权限不正确或其他问题,无法配置或创建 AI 服务的必需组件之一。这些组件包括 DNS 或 Ingress 等。
  • FM4 - 服务未达到 Enabled 状态:在提示启用流程后,预训练的服务无法就绪。该页面会显示一项或多项服务以及可能的人工智能基础设施的 Enabling 状态,而不会更改为 Enabled 状态。

界面故障

界面故障是由以下某种 FM 造成的:

  • 前端和后端通信失败:页面会显示一条错误消息,指出后端通信存在问题。错误日志条目的代码介于 AIPL0500AIPL0502 之间。
  • 页面上未显示服务 API 端点:如果出现错误,页面会显示 Unable to fetch the endpoint 消息,而不是端点。