作业虚拟机的操作系统环境概览

本文档介绍了运行批处理作业的 Compute Engine 虚拟机 (VM) 实例的操作系统 (OS) 环境(启动磁盘和操作系统映像)的相关概念。

作业是通过在其每个虚拟机的启动磁盘上运行指令来执行的。每个启动磁盘均包含一个引导加载程序、文件系统和操作系统。 您可以选择执行以下任一操作,为作业配置虚拟机操作系统环境:

  • 要仅配置启动磁盘上的软件,请指定 虚拟机操作系统映像
  • 如需配置启动磁盘的任何属性(包括虚拟机操作系统映像),请执行以下操作: 磁盘大小和/或磁盘类型 - 自定义作业的启动磁盘。

以下部分介绍了何时配置操作系统环境、默认操作系统环境、虚拟机操作系统映像选项和启动磁盘选项。

何时配置操作系统环境

请参阅本部分,确定是在创建作业时配置虚拟机操作系统映像和/或启动磁盘,还是使用默认配置。

在以下情况下,请为作业配置虚拟机操作系统映像:

  • 如果可信映像 (compute.trustedImageProjects) 政策限制条件 禁止您使用默认虚拟机操作系统映像创建作业。

    如需详细了解可信映像政策限制条件,请参阅 控制对 Batch 的虚拟机操作系统映像的访问权限

  • 您不想或不能使用作业的默认虚拟机操作系统映像。 例如,如果您为某个作业定义的可运行对象 需要默认映像不支持的应用 您也许可以指定其他公共虚拟机操作系统映像 或者,如果您想预安装作业所需的应用以缩短运行时间,则可以创建并指定自定义映像。

在以下情况下,请为作业配置启动磁盘:

  • 您不想或不能使用默认启动磁盘来完成作业。 例如,如果您为某项作业定义的可运行组件或虚拟机操作系统映像 启动磁盘上需要额外的存储空间,那么您可能需要 为作业自定义启动磁盘以增加其大小。

如果您仍不确定作业是否需要您配置虚拟机操作系统映像和/或启动磁盘,可以查看以下部分,了解默认配置。此外,您还可以直接尝试创建并运行 并采用默认配置如果使用默认配置的作业运行失败, 您可以尝试确定问题是由虚拟机操作系统映像导致的 启动磁盘(通过问题排查)。

否则,如果您不需要也不想为作业配置虚拟机操作系统映像和/或启动磁盘,请将这些属性保持未定义状态,以使用默认配置。

默认操作系统环境

请参阅本部分,了解作业虚拟机操作系统映像和启动磁盘的默认配置。例如,在确定如何为作业配置操作系统环境时,您可以将默认配置用作参考。

如果您创建作业并且没有定义虚拟机操作系统映像,则作业将默认为 使用以下虚拟机操作系统映像之一:

  • 如果作业只有容器可运行组件,则该作业会使用最新版本 Batch Container-Optimized OS (COS) 映像的状态。
  • 否则,作业将使用最新版本的批处理 Debian 映像。

如果您在创建作业时没有定义启动磁盘的其他属性, 该作业默认使用以下选项:

  • 永久性磁盘类型:启动磁盘的默认永久性磁盘类型为 pd-balanced

  • size: 每个虚拟机的启动磁盘由 \({defaultBootDiskSize}\)的公式。此外,默认尺寸为 舍入为 30 GB 到 10,000 GB 之间的整数。

    \[{defaultBootDiskSize}={reservedSize}+({taskSize}*{parallelTasksPerVm})\]

    此公式具有以下值:

  • 接口:系统会根据作业虚拟机的机器类型自动选择 NVMeSCSI 接口。在定义作业要使用的资源类型时,您可以选择指定机器类型。如需了解每种机器类型的默认接口,请参阅 Compute Engine 文档中的选择接口

虚拟机操作系统映像选项

以下部分介绍了 Cloud Storage 中 批处理,包括在集群内运行的所有虚拟机操作系统映像 批量作业可以支持和限制 以及受支持的虚拟机操作系统映像 为作业指定虚拟机操作系统映像时,您可以为限制允许的任何受支持的虚拟机操作系统映像指定映像名称或映像系列。

支持的虚拟机操作系统映像

批处理作业可以支持以下类型的虚拟机操作系统映像:

  • 公共映像:由 Google、开源社区和第三方供应商提供和维护的映像。具体来说,批处理作业可以使用 Batch 或 Compute Engine。

    • 批处理映像:由批处理根据 Compute Engine 操作系统提供和维护的映像,存储在 batch-custom-image 映像项目中,建议用于批处理作业。

      批量映像可在以下操作系统中使用。 在 Batch 中查看映像系列和映像名称时, 操作系统由相应的前缀指示。

      • 批量高性能计算 (HPC) CentOS (batch-hpc-centos 前缀):一种基于 Compute Engine 中的 HPC CentOS 映像 的操作系统,针对包含 HPC 工作负载的批量作业进行了优化。

      若要从以下位置查看特定映像名称和系列: 为作业指定的批次,请按以下步骤 从 Batch 中查看虚拟机操作系统映像

    • Compute Engine 映像:Compute Engine 上提供的公共映像,详见 Compute Engine 文档中的操作系统详情页面。

      批处理作业仅支持以下操作系统的正式版 (GA) Compute Engine 映像:

  • 自定义映像:您使用 Compute Engine 创建、拥有并控制访问权限的映像。如需详细了解自定义映像,请参阅 Compute Engine 文档。

虚拟机操作系统映像的限制

作业可以指定的受支持虚拟机操作系统映像受以下限制 限制:

  • 系统可能不支持标记为已弃用的批量图片。Batch 支持的最短生命周期 images 是以下日期中的最早日期:

    • 图片的开始日期之后 60 天。批量映像的开始日期会显示在映像名称中,例如 batch-cos-stable-official-20230719-00-p00 映像的开始日期为 2023 年 7 月 19 日 (20230719)。
    • 基本 Compute Engine 操作系统版本被弃用的日期。 Compute Engine 文档的操作系统详细信息页面列出了每个 Compute Engine 操作系统版本的弃用日期。
  • 某些作业配置需要对映像进行外部访问。具体而言,当作业没有外部访问权限且不允许通过 Cloud NAT 或专用 Google 访问通道进行访问时,仅支持以下映像:

    • 对于使用 GPU 且仅使用容器可运行的作业,只有 默认图片 (最新的 Batch Container-Optimized OS 映像) 。
    • 否则,作业仅支持批处理图片。
  • 如果启用了可信映像政策限制,您将无法使用可信映像政策不允许的任何虚拟机操作系统映像。

    项目、文件夹或组织的管理员可以选择性地 配置可信映像政策限制条件 可用于创建启动磁盘的虚拟机操作系统映像。例如: 可信映像政策限制条件可用于要求用户创建 包含符合政策或安全性要求且已获批准的软件的虚拟机 要求。如需了解详情,请参阅 控制对 Batch 的虚拟机操作系统映像的访问权限

  • 作业的虚拟机操作系统映像必须包含接口的驱动程序 及其启动磁盘中的任何一个 永久性磁盘存储卷 已安装。大多数公共映像都会自动安装 NVMe 和 SCSI 驱动程序,包括所有批处理映像。

    您无法配置永久性磁盘的接口,因此虚拟机操作系统映像需要默认接口的驱动程序。

  • 如果作业指定的任何虚拟机操作系统映像不属于 基于容器的批处理映像或自定义映像 批量映像(需要批量安装) 为作业的虚拟机应用软件包所需的软件包可能会有所不同 并会随时间推移而发生变化, 以便 Batch 运行该作业。

启动磁盘选项

本部分介绍了适用于批处理的启动磁盘类型和大小选项。为作业自定义启动磁盘时,您可以指定虚拟机操作系统映像、类型和/或大小。如需了解如何指定虚拟机操作系统映像,请改为参阅本文档中的虚拟机操作系统映像选项

对于启动磁盘类型,批处理支持 Compute Engine 文档中的所有永久性磁盘类型

对于启动磁盘大小,批处理支持 Compute Engine 文档中满足以下要求的所有永久性磁盘大小和增量

  • 对于批处理作业,启动磁盘的大小不得低于 30 GB。

  • 为了让批处理作业正常运行,启动磁盘的大小必须足够大,能够分配作业的虚拟机操作系统映像以及在每个虚拟机上运行的任务。有关示例,请参阅 默认启动磁盘大小的公式

后续步骤