购买预配吞吐量

本页面介绍了在订阅预配吞吐量之前需要考虑的详细信息、您在下达或查看预配吞吐量订单时必须拥有的权限,以及下达和查看订单的说明。

购买前要考虑的事项

在决定是否要购买预配吞吐量时,请考虑以下事项:

  • 您无法在订阅期内取消订阅。

    预配吞吐量购买交易属于承诺,这意味着您无法在订阅期内取消订单。不过,您可以增加购买的 GSU 数量。如果您无意中购买了承诺,或者配置出现问题,请与您的 Google Cloud 客户代表联系以获取帮助。

  • 您可以自动续订订阅

    提交订单时,您可以选择在订阅期结束时自动续订订阅,也可以让订阅到期。您可以取消自动续订流程。如需在自动续订前取消订阅,请在下一个订阅期开始前 30 天取消自动续订。

    您可以将按月订阅配置为每月自动续订。按周订阅期不支持自动续期。

    如需了解详情,请参阅更改预配吞吐量订单。您还可以与您的 Google Cloud 客户代表联系以获取帮助。

  • 您可以更改模型版本或区域,但需事先通知我们。

    在您选择项目、区域、模型和版本,并且订单获得批准和激活后,预配吞吐量便会启用。您可以使用 Google Cloud 控制台将 Google 模型或模型版本更改为新的 Google 模型或模型版本。

    如需了解详情,请参阅更改预配吞吐量订单。您还可以与您的 Google Cloud 客户代表联系以获取帮助。

    我们会尽力处理更改请求,通常在初次请求后的 10 个工作日内完成。更改区域或项目需要先启用新订单,然后再取消之前的订单。

    您只能在来自同一供应商的不同模型之间切换。例如,您可以在 Google 的各个模型之间或在合作伙伴 A 的各个模型之间切换。不过,您无法在 Google 的模型与合作伙伴 A 的模型之间切换。

  • 默认情况下,超额费用以随用随付形式结算。

    如果您的吞吐量超出预配吞吐量订单金额,超出部分将按标准随用随付方式处理和结算。您可以按请求控制超额费用。如需了解详情,请参阅使用预配吞吐量

如需了解价格,请参阅预配吞吐量

权限

如需使用预配吞吐量,必须授予以下角色:

  • roles/aiplatform.provisionedThroughputAdmin:您可以访问 Vertex AI 预配吞吐量资源。

此角色会向您授予以下权限:

  • aiplatform.provisionedThroughputs.create:您可以在项目中提交预配吞吐量订单。

  • aiplatform.provisionedThroughputs.list:您可以在项目中查看所有预配吞吐量订单。

下达预配的吞吐量订单

在下单以使用 Imagen 模型之前,请提交请求授予权限表单,以便获得权限。

在您下单以使用 MedLM-large-1.5 之前,请与您的 Google Cloud 客户代表联系,以申请访问权限。如果您希望 QPM 超过 30,000,那么为了最大限度地利用预配吞吐量订单,请使用以下信息请求增加默认 Vertex AI 系统配额:

  • 服务:Vertex AI API。
  • 名称Online prediction requests per minute per region
  • 服务类型:配额。
  • 维度:您订购预配吞吐量的区域。
  • :这是您选择的在线预测流量上限。

如需购买预配吞吐量,请按以下步骤操作:

控制台
  1. 在 Google Cloud 控制台中,前往“预配吞吐量”页面。

    前往“预配的吞吐量”

  2. 如需开始新订单,请点击创建
  3. 输入订单名称
  4. 选择模型
  5. 选择地区
  6. 输入您必须购买的生成式 AI 扩缩单元 (GSU) 的数量。如果您必须估算 GSU 数量,请点击估算工具
    1. 选择模型
    2. 输入每秒查询次数
    3. 输入每次查询的输入字符数
    4. 输入每次查询的输入图片数
    5. 输入每次查询的视频秒数
    6. 输入每次查询的音频秒数
    7. 输入每次查询的输出字符数
    8. 如果您想使用在估算工具中输入的值,请点击使用计算值
  7. 选择期限

    如果您选择一周,则可以选择提供下单后两周内的开始日期和时间。如果您未提供开始日期和时间,我们会在确保容量可用的情况下尽快处理订单。我们会尽力按照所要求的开始日期和时间处理订单,但如果订单状态未设置为已批准,我们无法保证能够按照要求的时间履行订单。

    如果您请求的开始日期与当前日期过于接近,您的订单可能会在您请求的开始日期之后获得批准并激活,这意味着您的结束日期将距离激活日期还剩 7 天。

  8. 选择续订选项。
  9. 点击继续
  10. 摘要部分,查看订单的价格和吞吐量估算值。阅读表单中列出的条款及链接。
  11. 如需完成订单,请点击确认

更改预配吞吐量订单

下表介绍了如何根据订单状态和任何现有条件,通过 Google Cloud 控制台修改预配吞吐量订单。如需申请获得这些预览版功能的访问权限,请填写并提交预配吞吐量访问权限控制表单

订单状态 操作 备注 在 Google Cloud 控制台中执行的步骤
待审核 您可以取消订单。

如果您要对订单进行其他更改,请取消待处理订单,然后重新下单。

如果您有多个模型,则每个模型一次只能有一个待处理订单修订版本或待处理订单。

如需在 Google Cloud 控制台中取消待处理订单,请执行以下操作:
  1. 前往预配吞吐量页面
  2. 选择待处理订单所在的区域
  3. 如需前往订单详情页面,请点击要取消的订单的订单 ID
  4. 点击取消
  5. 确定要取消订单吗?对话框中,点击取消订单
有效

您可以增加现有订单的 GSU。

您可以启用或停用自动续订。

您可以更改模型或模型版本。

如果同时满足以下两个条件,则无法更改订单:
  • 订单失效日期距现在不到 5 天。
  • 订单未设置为自动续订。
如需在 Google Cloud 控制台中更改有效订单,请使用以下方法之一:
  • 预配吞吐量页面中,点击操作列中的符号,然后点击修改
  • 订单详情页面中,点击修改按钮。

检查订单状态

提交预配置吞吐量订单后,订单状态可能会显示为以下某项:

  • 待审核:您已下单。由于批准取决于预留订单的空闲容量,因此您的订单正在等待审核和批准。如需详细了解待处理订单的状态,请与您的 Google Cloud 客户代表联系
  • 已批准:Google 已批准您的订单。
  • 有效:Google 已激活您的订单,计费已开始。
  • 已过期:您的订单已过期。

查看预配吞吐量订单

请按照以下步骤查看预分配吞吐量的订单:

控制台
  1. 在 Google Cloud 控制台中,前往“预配吞吐量”页面。

    前往“预配的吞吐量”

  2. 选择地区。 系统会显示您的订单列表。

后续步骤