本页面介绍了在订阅预配吞吐量之前需要考虑的详细信息、您在下达或查看预配吞吐量订单时必须拥有的权限,以及下达和查看订单的说明。
购买前要考虑的事项
在决定是否要购买预配吞吐量时,请考虑以下事项:
您无法在订阅期内取消订阅。
预配吞吐量购买交易属于承诺,这意味着您无法在订阅期内取消订单。不过,您可以增加购买的 GSU 数量。如果您无意中购买了承诺,或者配置出现问题,请与您的 Google Cloud 客户代表联系以获取帮助。
您可以自动续订订阅。
提交订单时,您可以选择在订阅期结束时自动续订订阅,也可以让订阅到期。您可以取消自动续订流程。如需在自动续订前取消订阅,请在下一个订阅期开始前 30 天取消自动续订。
您可以将按月订阅配置为每月自动续订。按周订阅期不支持自动续期。
如需了解详情,请参阅更改预配吞吐量订单。您还可以与您的 Google Cloud 客户代表联系以获取帮助。
您可以更改模型版本或区域,但需事先通知我们。
在您选择项目、区域、模型和版本,并且订单获得批准和激活后,预配吞吐量便会启用。您可以使用 Google Cloud 控制台将 Google 模型或模型版本更改为新的 Google 模型或模型版本。
如需了解详情,请参阅更改预配吞吐量订单。您还可以与您的 Google Cloud 客户代表联系以获取帮助。
我们会尽力处理更改请求,通常在初次请求后的 10 个工作日内完成。更改区域或项目需要先启用新订单,然后再取消之前的订单。
您只能在来自同一供应商的不同模型之间切换。例如,您可以在 Google 的各个模型之间或在合作伙伴 A 的各个模型之间切换。不过,您无法在 Google 的模型与合作伙伴 A 的模型之间切换。
默认情况下,超额费用以随用随付形式结算。
如果您的吞吐量超出预配吞吐量订单金额,超出部分将按标准随用随付方式处理和结算。您可以按请求控制超额费用。如需了解详情,请参阅使用预配吞吐量。
如需了解价格,请参阅预配吞吐量。
权限
如需使用预配吞吐量,必须授予以下角色:
roles/aiplatform.provisionedThroughputAdmin
:您可以访问 Vertex AI 预配吞吐量资源。
此角色会向您授予以下权限:
aiplatform.provisionedThroughputs.create
:您可以在项目中提交预配吞吐量订单。aiplatform.provisionedThroughputs.list
:您可以在项目中查看所有预配吞吐量订单。
下达预配的吞吐量订单
在下单以使用 Imagen 模型之前,请提交请求授予权限表单,以便获得权限。
在您下单以使用 MedLM-large-1.5 之前,请与您的 Google Cloud 客户代表联系,以申请访问权限。如果您希望 QPM 超过 30,000,那么为了最大限度地利用预配吞吐量订单,请使用以下信息请求增加默认 Vertex AI 系统配额:
- 服务:Vertex AI API。
- 名称:
Online prediction requests per minute per region
- 服务类型:配额。
- 维度:您订购预配吞吐量的区域。
- 值:这是您选择的在线预测流量上限。
如需购买预配吞吐量,请按以下步骤操作:
- 在 Google Cloud 控制台中,前往“预配吞吐量”页面。
- 如需开始新订单,请点击创建。
- 输入订单名称。
- 选择模型。
- 选择地区。
- 输入您必须购买的生成式 AI 扩缩单元 (GSU) 的数量。如果您必须估算 GSU 数量,请点击估算工具。
- 选择模型。
- 输入每秒查询次数。
- 输入每次查询的输入字符数。
- 输入每次查询的输入图片数。
- 输入每次查询的视频秒数。
- 输入每次查询的音频秒数。
- 输入每次查询的输出字符数。
- 如果您想使用在估算工具中输入的值,请点击使用计算值。
- 选择期限。
如果您选择一周,则可以选择提供下单后两周内的开始日期和时间。如果您未提供开始日期和时间,我们会在确保容量可用的情况下尽快处理订单。我们会尽力按照所要求的开始日期和时间处理订单,但如果订单状态未设置为已批准,我们无法保证能够按照要求的时间履行订单。
如果您请求的开始日期与当前日期过于接近,您的订单可能会在您请求的开始日期之后获得批准并激活,这意味着您的结束日期将距离激活日期还剩 7 天。
- 选择续订选项。
- 点击继续。
- 在摘要部分,查看订单的价格和吞吐量估算值。阅读表单中列出的条款及链接。
- 如需完成订单,请点击确认。
更改预配吞吐量订单
下表介绍了如何根据订单状态和任何现有条件,通过 Google Cloud 控制台修改预配吞吐量订单。如需申请获得这些预览版功能的访问权限,请填写并提交预配吞吐量访问权限控制表单。
订单状态 | 操作 | 备注 | 在 Google Cloud 控制台中执行的步骤 |
---|---|---|---|
待审核 | 您可以取消订单。 |
如果您要对订单进行其他更改,请取消待处理订单,然后重新下单。 如果您有多个模型,则每个模型一次只能有一个待处理订单修订版本或待处理订单。 |
如需在 Google Cloud 控制台中取消待处理订单,请执行以下操作:
|
有效 |
您可以增加现有订单的 GSU。 您可以启用或停用自动续订。 您可以更改模型或模型版本。 |
如果同时满足以下两个条件,则无法更改订单:
|
如需在 Google Cloud 控制台中更改有效订单,请使用以下方法之一:
|
检查订单状态
提交预配置吞吐量订单后,订单状态可能会显示为以下某项:
- 待审核:您已下单。由于批准取决于预留订单的空闲容量,因此您的订单正在等待审核和批准。如需详细了解待处理订单的状态,请与您的 Google Cloud 客户代表联系。
- 已批准:Google 已批准您的订单。
- 有效:Google 已激活您的订单,计费已开始。
- 已过期:您的订单已过期。
查看预配吞吐量订单
请按照以下步骤查看预分配吞吐量的订单:
- 在 Google Cloud 控制台中,前往“预配吞吐量”页面。
- 选择地区。 系统会显示您的订单列表。