关于 MIG 中的调整大小请求


本文档介绍托管式实例组 (MIG) 中请求调整大小的工作原理及其限制。使用调整大小请求在 MIG 中一次性创建具有 GPU 的虚拟机 (VM) 实例。

在以下场景中,通过调整大小请求在 MIG 中同时创建所有虚拟机非常有用:

  • 如果您希望 GPU 虚拟机仅在特定时间运行,调整大小请求会增加获得 GPU(需求量很高的资源)的几率。

  • 如果您希望使用确切数量的虚拟机来运行作业,调整大小请求可帮助您一次性创建所有虚拟机。通过使用调整大小请求,您还可以避免在等待所有资源可用时对 Compute Engine 创建的部分容量产生不必要的费用。

调整大小请求的工作原理

创建调整大小请求时,必须指定以下内容:

  • resizeBy:您要在请求中一次性创建的所有虚拟机的数量。

  • requestedRunDuration:作为请求一部分创建的虚拟机必须运行的时长。运行时长必须介于 10 分钟到 7 天之间。运行时长结束时,MIG 会删除已创建的虚拟机。

当您在 MIG 中创建调整大小请求时,Compute Engine 会将请求的状态设置为 CREATING,然后在请求创建后将其转换为 ACCEPTED动态工作负载调度器 (DWS) 是底层调度器机制,可根据请求的时长和资源可用性来调度在 Compute Engine 中创建的调整大小请求。

在 DWS 安排创建请求数量的虚拟机后,MIG 会按请求的虚拟机数量增加其目标大小,并创建状态为 CREATING托管式实例。这些托管式实例代表 MIG 在调整大小请求成功时将创建的虚拟机。除非您取消调整大小请求,否则无法删除处于 CREATING 状态的托管式实例。

如果您缺少所请求资源的配额或资源暂时不可用,则 DWS 会一直保留该请求,直到您有足够的配额并且资源可用。

已接受的调整大小请求将保持不变,直到 Compute Engine 将其设置为以下状态之一:

  • SUCCEEDED:MIG 一次性创建了请求的所有虚拟机。虚拟机会一直运行,直到 MIG 在指定运行时长结束后删除它们或直到您删除它们。

  • FAILED:由于技术错误,大小调整请求失败,并且 Compute Engine 会按请求的虚拟机数量减少 MIG 的目标大小。

  • CANCELLED:用户取消了调整大小请求,Compute Engine 按请求的虚拟机数量减少了 MIG 的目标大小。如果您想阻止已接受的调整大小请求创建虚拟机,则必须取消调整大小请求,然后可以选择将其删除。如果您未删除取消的调整大小请求,Compute Engine 会在请求取消 14 天后自动删除请求。

如需检查已接受的调整大小请求的状态或进行问题排查,请查看调整大小请求的详细信息

如果您删除包含调整大小请求的 MIG,则此操作还会删除该 MIG 中的所有调整大小请求和虚拟机。但是,如果您在 MIG 创建虚拟机以满足大小调整请求时删除 MIG,则 Compute Engine 将等待该 MIG 创建完请求的虚拟机数量以及大小调整请求的状态转换为 SUCCEEDED,然后再删除 MIG。

限制

以下部分概述了在 MIG 中创建调整大小请求的限制。

调整大小请求的限制

对于调整大小请求,存在以下限制:

  • 您只能使用调整大小请求获取 GPU 虚拟机。

  • 您只能在可用区级 MIG 中创建调整大小请求。

  • 您只能取消接受的 (ACCEPTED) 调整大小请求。

  • 只有在调整大小请求成功 (SUCCEEDED)、失败 (FAILED) 或用户取消该请求 (CANCELLED) 后,您才能将其删除。

实例模板的限制

对于要在其中创建调整大小请求的 MIG 中使用的实例模板,存在以下限制:

MIG 的限制

对于您要创建调整大小请求的 MIG,存在以下限制:

具有请求的运行时长的 GPU 虚拟机的配额

配置为在预定义的运行时间(7 天或更短时间)后自动删除的 GPU 虚拟机可以使用抢占式分配配额或标准分配配额。此行为旨在帮助您提高临时但不中断的工作负载的分配配额的可获取性。如需详细了解此行为,请参阅 GPU 虚拟机和抢占式分配配额

价格

创建、取消或删除调整大小请求不会产生任何相关费用。您只需为通过调整大小请求创建的虚拟机支付费用,从 MIG 创建虚拟机的那一刻起,到 MIG 在其运行时长结束时自动删除虚拟机或您手动删除虚拟机为止。

如果 MIG 仅创建了部分请求的虚拟机,并且未能创建其余的虚拟机,那么在 MIG 将其自动删除之前,您仍可能需要为已创建的虚拟机付费。

后续步骤