灵活启动虚拟机简介

本文档概述了灵活启动虚拟机,详细介绍了其主要特征,以及您在创建此类虚拟机时需要遵守的要求和限制。

弹性启动虚拟机 (VM) 实例专为可以随时启动的工作负载而设计。灵活启动虚拟机会在资源可用时启动,最多可运行 7 天。您可以使用灵活启动预配模型创建灵活启动虚拟机。此模型依赖于动态工作负载调度器 (DWS) 从安全的容量池中预配资源,从而提高您获得 GPU 等高需求资源的几率。

灵活启动虚拟机非常适合运行以下工作负载:

  • 小型模型预训练

  • 模型微调

  • 高性能计算 (HPC) 模拟

  • 批量推理

灵活启动型虚拟机支持所有加速器优化型机器类型(A4X 和 G4 除外)和 H4D 机器类型。对于 A4、A3、A2 和 H4D 机器类型,您可以以折扣价获得 vCPU、内存和任何附加的 GPU。

对于需要资源的时间超过 7 天或需要更高容量保证的工作负载,您可以在日历模式下创建未来预留请求,以便继续享受 DWS 折扣。

灵活启动虚拟机的主要特征

与其他类型的 Compute Engine 实例相比,灵活启动型虚拟机具有以下特征:

  • 资源分配等待时间:您可以在 Compute Engine 分配所请求的资源之前创建灵活启动型虚拟机。不过,只有在您指定的时间范围内资源可用时,虚拟机才会启动。如果资源不可用,则虚拟机创建请求会失败

    如需了解详情,请参阅本文档中的灵活启动型虚拟机的等待时间

  • 运行时间有限:灵活启动虚拟机最多可运行 7 天。之后,Compute Engine 会根据虚拟机属性中指定的终止操作自动停止或删除虚拟机。

    如需了解详情,请参阅本文档中的灵活启动虚拟机的有限运行时长

  • 灵活启动预配模型:您可以使用灵活启动预配模型创建灵活启动虚拟机。 与使用标准配置模型创建的虚拟机相比,此配置模型可提供更高的资源可用性和更优惠的价格。

    如需详细了解每种预配模型,请参阅 Compute Engine 实例预配模型

灵活启动虚拟机的等待时间

创建灵活启动虚拟机后,该虚拟机不会立即启动。Compute Engine 会尝试在特定时间范围内分配您请求的资源并启动虚拟机。如果您有足够的配额来满足所请求的资源,并且 Compute Engine 在等待时间结束之前分配了这些资源,那么在容量可用后两分钟内,弹性启动虚拟机就会启动。否则,虚拟机创建请求会失败。

等待时间因您用于创建虚拟机的方法而异:

独立灵活启动虚拟机的等待时间

如需创建独立的灵活启动虚拟机,您必须使用 requestValidForDuration 字段指定等待时间。您可以将等待时间设置为零秒,也可以设置为介于 90 秒到 7,200 秒(两小时)之间的任意值。

根据工作负载的可用区要求,我们建议您设置以下等待时间,以提高 Flex-start 虚拟机创建请求的成功几率:

  • 严格的可用区要求:如果您的工作负载要求您在特定可用区中创建 Flex-start 虚拟机,我们建议您将 requestValidForDuration 字段设置为 90 秒或更长时间,最长可设置为 2 小时。等待时间越长,获得资源的几率就越大。 在此期间,虚拟机始终处于 PENDING 状态

  • 无可用区要求:如果灵活启动的虚拟机可以在区域中的任何可用区运行,建议您将 requestValidForDuration 字段设置为零秒。此值指定 Compute Engine 仅在资源立即可用时才分配资源。如果您的请求因资源不可用而失败,请尝试在其他可用区中创建 Flex-start 虚拟机。

如需在 Compute Engine 尝试分配资源时停止虚拟机创建请求,请删除 Flex-start 虚拟机。

MIG 调整大小请求等待时间

如果您使用调整大小请求将灵活启动虚拟机一次性添加到托管式实例组 (MIG),则预配所有请求的资源所需的等待时间是不确定的。创建 MIG 调整大小请求后,该请求会保持 ACCEPTED 状态,直到资源可用。如果所请求的资源可用,MIG 调整大小请求状态会变为 SUCCEEDED,并且 Compute Engine 会创建灵活启动虚拟机。

如需在 Compute Engine 尝试分配资源时停止虚拟机创建请求,请取消 MIG 调整大小请求。如需了解详情,请参阅关于 MIG 调整大小请求

灵活启动虚拟机的有限运行时长

创建灵活启动型虚拟机时,您必须指定以下内容:

  • 虚拟机运行时长:您必须指定虚拟机的运行时长。运行时长可以介于 10 分钟到 7 天之间。如果您不再需要这些虚拟机,可以选择停止或删除独立虚拟机,也可以删除使用 MIG 规模调整请求创建的虚拟机。

  • 虚拟机终止操作:您必须选择 Compute Engine 在虚拟机运行时长结束时是自动停止还是删除这些虚拟机。

配额

如需创建或重启灵活启动型虚拟机,您必须有足够的抢占式配额,以满足所请求的 vCPU、内存以及任何附加的 GPU 或本地 SSD 磁盘的需求。

如果您尝试创建或重启配额不足的灵活启动虚拟机,则会发生以下情况之一:

  • 虚拟机创建请求:在您获得足够的配额之前,您的请求将一直处于待处理状态。如果您未在等待时间结束前获得所需配额,则请求会失败。

  • 虚拟机重启请求:您的请求会立即失败。

价格

对于灵活启动虚拟机,您需要支付以下费用:

  • 随用随付 (PAYG)。如需详细了解虚拟机在其生命周期内的价格,请参阅价格

  • 对于 A4、A3、A2 和 H4D 机器类型,您可以以折扣价获得 vCPU、内存和任何连接的 GPU。其他受支持的加速器优化机器类型不符合享受折扣的条件。如需了解详情,请参阅 DWS 定价

限制

灵活启动的虚拟机具有以下限制:

后续步骤

自行试用

如果您是 Google Cloud 新手,请创建一个账号来评估 Compute Engine 在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。

免费试用 Compute Engine