Vertex AI 服务等级协议 (SLA)

上次修改日期:2021 年 5 月 18 日 | 过往版本

在 Google 同意向客户提供 Google Cloud Platform 的协议(如适用,下称“协议”)期限内,涵盖的服务为客户提供每月正常运行时间百分比(以下统称“服务等级目标”或“SLO”)达到以下标准:

涵盖服务 每月正常运行时间百分比
训练、部署和批量预测 >= 99.9%
适用于部署在 2 个或更多节点上的模型的 AutoML 表格和 AutoML 图片在线预测 >= 99.9%
AutoML 文本语言在线预测 >= 99.9%
适用于部署在 2 个或更多节点上的模型的自定义模型在线预测 >= 99.5%

如果 Google 未达到 SLO 规定的服务等级,而客户履行了本 SLA 规定的义务,则客户将有资格获得如下所述的财务补偿。当 Google 未能达到 SLO 规定的服务等级时,客户可获得的唯一且排他性补偿以本 SLA 所述为准。对于本 SLA 中用到但未提供定义的术语,其含义与“协议”中规定的含义相同。如果“协议”根据 Google Cloud 合作伙伴或转销商计划授权转售或提供 Google Cloud Platform,则本 SLA 中提到的所有“客户”均指“合作伙伴”或“转销商”(如适用),任何财务补偿仅适用于根据该协议受影响的合作伙伴或转销商订单。

定义

以下定义适用于 SLA:

  • 退避条件”是指发生错误后,客户应等待一段时间后再发出另一个请求。这意味着在第一个错误发生后有一段最短为 1 秒钟的退避间隔,而对于每个连续性错误,退避间隔时长可指数式增加至最长 32 秒。
  • 涵盖的服务”是指上表中“涵盖的服务”列下列出的适用 Vertex AI 服务。
  • 停机时间是指错误率超过 5%。停机时间根据服务器端的错误率来计量。
  • 停机时间段是指持续停机一分钟或更长时间的时间段。不满一分钟的零散或间歇性停机时间不会计入任何停机时间段。
  • 错误率”是指导致“HTTP Status 500”或“HTTP Status 503”响应的有效请求的数量与该时段内总有效请求数量的比值。重复的相同请求不计入错误率,除非它们符合退避要求。
  • 对于训练、部署和批量预测;适用于部署在 2 个或更多节点上的模型的 AutoML 表格和 AutoML 图片在线预测;或 AutoML 文本在线预测,“财务补偿”的具体规定如下:

    每月正常运行时间百分比 若涵盖的服务未达到 SLO 规定,则提供当月月度帐单的以下百分比作为财务补偿(可用于抵扣客户未来的月度帐单中的费用)
    99% 到 < 99.9% 10%
    95% - < 99% 25%
    < 95% 50%
  • 对于适用于部署在 2 个或更多节点上的模型的自定义模型在线预测,“财务补偿”的具体规定如下:

    每月正常运行时间百分比 若涵盖的服务未达到 SLO 规定,则提供当月月度帐单的以下百分比作为财务补偿(可用于抵扣客户未来的月度帐单中的费用)
    99% - < 99.5% 10%
    95% - < 99% 25%
    < 95% 50%
  • 每月正常运行时间百分比等于一个月的总分钟数减去一个月内所有停机时间段内的停机时间分钟数,然后除以一个月的总分钟数。

  • “有效请求”是指符合文档要求,通常不会出现错误响应的请求。

客户必须申请财务补偿

若要获得上述任何一种财务补偿,客户必须在有资格获得财务补偿的 30 天内通知 Google 技术支持。客户还必须向 Google 提供识别性信息(例如项目 ID 和作业 ID)以及发生错误的日期和时间。如果不遵守这些要求,客户将失去获得财务补偿的权利。

财务补偿上限

对于单个结算月份内出现的任何和全部停机时间段,Google 向客户发放的最高财务补偿总金额不会超过客户在适用月份中涵盖的服务的应付金额的 50%。财务补偿将以货币补偿的形式发放,可用于抵扣未来的服务使用费用,并且应在要求财务补偿后的 60 天内使用。

SLA 例外情况

本服务等级协议 (SLA) 不适用于以下方面:(a) 正式版前指定的特征(除非相关文档中另有规定);(b) 被排除在 SLA 之外的特征(在相关文档中);(c) (i) 由 Google 的合理控制之外的因素造成的错误;(ii) 由客户和/或第三方的软硬件造成的错误;(iii) 由违反协议的滥用或其他行为造成的错误;(iv) 由系统实施的配额或管理控制台中列出的配额造成的错误;或 (v) 因客户对涵盖的服务的使用不符合文档规定而导致错误,包括但不限于请求字段无效、用户未获授权、数据无法访问,或者使用超出建议的模型生命周期的模型(如适用文档中所述)。

过往版本