关于 MIG 中的调整大小请求


本文档介绍托管式实例组 (MIG) 中请求调整大小的工作原理及其限制。使用调整大小请求,在 MIG 中一次性创建具有 GPU 的虚拟机 (VM) 实例。

在以下场景中,通过调整大小请求在 MIG 中一次性创建所有虚拟机非常有用:

  • 如果您希望运行作业所需的虚拟机数量是确切的,调整大小请求可帮助您一次性创建所有虚拟机。这样有助于避免在等待所有资源可用时,因 Compute Engine 创建的部分容量而产生不必要的费用。

  • 如果您希望 GPU 虚拟机仅在特定时间运行,调整大小请求会增加获得这些需求量很高的资源的几率。

调整大小请求的工作原理

以下部分概述了调整大小请求的工作原理。

创建时

创建调整大小请求时,您必须指定以下属性:

  • resizeBy:您希望在请求中一次性创建的虚拟机数量。

  • requestedRunDuration:作为请求一部分而创建的虚拟机必须运行的时长。运行时长必须介于 10 分钟到 7 天之间。在运行时长结束时,MIG 会自动删除创建的虚拟机。当您在 MIG 中为 HyperCompute 集群创建调整大小请求时,此属性是可选的。如果您未在 HyperCompute 集群中为调整大小请求指定运行时长,则虚拟机会一直运行,直到 MIG 使用的预留结束为止。

创建之后

创建调整大小请求后,请求会经历不同的状态。下图显示了这些状态:

Compute Engine 可以将调整大小请求设置为的每种状态的图表。

上图中显示的状态如下:

  • CREATING:Compute Engine 正在创建调整大小请求,MIG 的目标大小会增加请求中指定的虚拟机数量,并且 MIG 会创建处于 CREATING 状态的托管实例。这些托管式实例代表 MIG 在调整大小请求成功时创建的虚拟机。

  • ACCEPTED:请求已创建并接受。底层调度器机制(即动态工作负载调度器 (DWS))会根据资源可用性和请求中指定的运行时长来调度所请求资源的创建。如果您缺少所请求资源的配额或资源暂时不可用,DWS 会保留请求,直到您有足够的配额且资源可用。

  • SUCCEEDED:MIG 一次性创建了请求的所有虚拟机。虚拟机会一直运行,直到 MIG 在指定运行时长结束后删除它们或直到您删除它们。

  • FAILED:由于技术错误,大小调整请求失败,并且 Compute Engine 将 MIG 的目标大小减少了请求的虚拟机数量。

  • CANCELLED:用户取消了调整大小请求。取消调整大小请求会阻止 MIG 创建所请求的资源。取消调整大小请求后,Compute Engine 会按所请求的虚拟机数量减小 MIG 的目标大小,并在 14 天后自动删除请求。(可选)您可以在 Compute Engine 自动删除调整大小请求之前删除调整大小请求

如果您删除包含调整大小请求的 MIG,此操作还会删除 MIG 中的所有调整大小请求和虚拟机。但是,如果您在 MIG 创建虚拟机以满足大小调整请求时删除 MIG,则 Compute Engine 将等待该 MIG 创建完请求的虚拟机数量以及大小调整请求的状态转换为 SUCCEEDED,然后再删除 MIG。

限制

以下部分概述了在 MIG 中创建调整大小请求时的限制。

对于调整大小请求

对于调整大小请求,适用以下限制:

  • 您只能使用调整大小请求来获取 GPU 虚拟机。

  • 您只能取消已接受 (ACCEPTED) 的调整大小请求。

  • 您只能在调整大小请求成功 (SUCCEEDED)、失败 (FAILED) 或被用户取消 (CANCELLED) 后删除该请求。

对于实例模板

对于您要在其中创建调整大小请求的 MIG 中使用的实例模板,适用以下限制:

对于 MIG

对于您要创建调整大小请求的 MIG,适用以下限制:

已请求运行时长的 GPU 虚拟机配额

配置为在预定义的运行时间(7 天或更短时间)后自动删除的 GPU 虚拟机可以使用抢占式分配配额或标准分配配额。此行为旨在帮助您提高临时但不中断的工作负载的分配配额的可获取性。如需详细了解此行为,请参阅 GPU 虚拟机和抢占式分配配额

价格

创建、取消或删除调整大小请求不会产生任何费用。您只需为通过调整大小请求创建的虚拟机付费,从 MIG 创建虚拟机的那一刻起,直到 MIG 在虚拟机运行时长结束时自动删除虚拟机或您手动删除虚拟机。

如果 MIG 仅创建了部分请求的虚拟机,而未能创建其余虚拟机,则您可能仍会因已创建的虚拟机而产生费用,直到 MIG 自动删除这些虚拟机为止。

后续步骤