加速器优化机器家族

本文档介绍了加速器优化机器家族，该机器家族可为您提供预先挂接了 NVIDIA GPU 的虚拟机 (VM) 实例。这些实例专为人工智能 (AI)、机器学习 (ML)、高性能计算 (HPC) 和图形密集型应用而设计。

加速器优化机器家族适用于以下机器系列：A4X、A4、A3、A2、G4 和 G2。一系列中的每个机器类型都有一个特定模型和挂接的 NVIDIA GPU 数量。您还可以将一些 GPU 模型挂接到 N1 通用机器类型。

按工作负载类型建议的机器系列

以下部分根据您的 GPU 工作负载介绍了建议的机器系列：

工作负载类型	建议的机器类型
预训练模型	A4X、A4、A3 Ultra、A3 Mega、A3 High 和 A2 如需确定最适合的机器类型或系列，请参阅 AI Hypercomputer 文档中的有关预训练模型的建议。
微调模型	A4X、A4、A3 Ultra、A3 Mega、A3 High、A2 和 G4（预览版）如需确定最适合的机器类型或系列，请参阅 AI Hypercomputer 文档中的有关微调模型的建议。
服务推理	A4X、A4、A3 Ultra、A3 Mega、A3 High、A3 Edge、A2 和 G4（预览版）如需确定最适合的机器类型或系列，请参阅 AI Hypercomputer 文档中的有关服务推理的建议。
图形密集型工作负载	G4（预览版）、G2 和 N1+T4
高性能计算	对于高性能计算工作负载，任何加速器优化机器系列都适合。最适合的机器类型或系列取决于必须分流到 GPU 的计算量。如需了解详情，请参阅 AI Hypercomputer 文档中的有关 HPC 的建议。

价格和使用选项

使用选项是指获取和使用计算资源的方式。Google Cloud 会针对加速器优化机器类型收取费用，费用包括挂接的 GPU、预定义 vCPU、内存和捆绑的本地 SSD（如果适用）。加速器优化实例的折扣因您所用的使用选项而异。如需详细了解加速器优化实例的价格信息，请参阅虚拟机实例价格页面上的加速器优化机器类型家族部分。

加速器优化实例的折扣因您选择的使用选项而异：

按需：您可以通过购买基于资源的承诺，为某些资源获得承诺使用折扣 (CUD)。不过，如果您使用的是按需选项，则 GPU 和本地 SSD 磁盘不符合 CUD 的条件。如需为 GPU 和本地 SSD 磁盘获得 CUD，请改用预留选项之一。
Spot：Spot 虚拟机可通过 Spot 虚拟机价格自动获得折扣。
灵活启动（预览版）：使用灵活启动使用选项预配的实例可以通过动态工作负载调度器价格自动获得折扣。
预留：您可以通过购买基于资源的承诺为加速器优化机器类型资源获得 CUD。GPU 和本地 SSD 磁盘的承诺需要为这些资源使用附加预留。

使用选项可用性（按机器类型）

下表总结了每种使用选项的可用性（按机器系列）。如需详细了解如何选择使用选项，请参阅 AI Hypercomputer 文档中的选择使用模式。

机器类型	按需	Spot	灵活启动（预览版）	按需预留	未来预留（预览版）	日历模式下的未来预留（预览版）	AI Hypercomputer 中的未来预留（预览版）
A4X
A4
A3 Ultra
A3 Mega 具有 8 个 GPU 的 A3 High A3 Edge
少于 8 个 GPU 的 A3 High
A2 Ultra 和 A2 Standard
G4（预览版）	¹
G2

¹如需了解如何访问此机器系列，请与您的 Google 客户支持团队联系。

A4X 机器系列

A4X 机器系列在基于 NVIDIA GB200 NVL72 机架级架构的艾级平台上运行，最多具有 140 个 vCPU 和 884 GB 内存。此机器系列针对计算和内存密集型、网络绑定机器学习训练和 HPC 工作负载进行了优化。A4X 机器系列提供一种机器类型。

使用 A4X 机器类型创建的虚拟机实例具有以下特性：

通过 NVIDIA GB200 超级芯片实现 GPU 加速：A4X 实例会自动挂接 NVIDIA GB200 超级芯片。这些超级芯片具有 NVIDIA B200 GPU，每个 GPU 可提供 180 GB 内存。A4X 有两个插槽，其中 NVIDIA Grace™ CPU 搭载 Arm® Neoverse™ V2 核心。这些 CPU 通过快速芯片间 (NVLink-C2C) 通信连接到四个 B200 GPU。
借力 NVIDIA Grace CPU 平台：A4X 实例使用 NVIDIA Grace CPU 平台。如需详细了解该平台，请参阅 CPU 平台。
业界领先的 NVLink 可伸缩性：多节点 NVLink，可在单个网域中扩容至最多 72 个 GPU。NVIDIA B200 GPU 为每个 GPU 双向提供 1, 800 GBps 的 GPU NVLink 带宽。得益于系统中的 4 个 GPU 之间采用全连接 NVLink 拓扑，总 NVLink 带宽可高达 130 TB/s。
通过 RoCE 增强网络性能：对于 A4X 实例，RDMA over Converged Ethernet (RoCE) 通过将 NVIDIA ConnectX-7 (CX-7) 网络接口卡 (NIC) 与 Google 的数据中心级四向轨道对齐网络相结合，可提高网络性能。与 A4 实例相比，通过利用 RDMA over Converged Ethernet (RoCE)，A4X 实例可在集群中的实例之间实现更高的吞吐量。

CX-7 NIC 在四向轨道对齐的网络拓扑上实现物理隔离，使 A4X 实例能够以 72 个 GPU 为一组进行横向扩容，从而在单个无阻塞集群中实现多达数千个 GPU。

注意：由于网络拓扑不同，您无法在 A4X 实例与使用其他上一代加速器优化机器系列创建的实例之间移动工作负载。
提高了网络速度：网络速度是使用 A3 机器类型创建的实例的 4 倍。
针对数据传输和恢复优化了虚拟化：A4X 实例的外设组件互连高速总线 (PCIe) 拓扑可提供更准确的位置信息，工作负载可使用这些信息来优化数据传输。

GPU 还公开了功能级重置 (FLR)，可从故障中正常恢复，并在某些情况下提供原子操作支持，可实现并发改进。
本地 SSD 和 Hyperdisk 支持：12,000 GiB 的本地 SSD 会自动添加到 A4X 实例。本地 SSD 可用于快速 scratch 磁盘或用于将数据输送到 GPU 中，同时防止 I/O 瓶颈。

对于需要更高存储性能的应用，您可以为 A4X 实例挂接高达 512 TiB 的 Hyperdisk。
支持密集分配和拓扑感知调度：通过 Cluster Director 预配 A4X 实例时，您可以请求密集分配的容量块。宿主机在物理上彼此靠近，并作为资源块预配，并通过动态机器学习网络结构相互连接，以最大限度地减少网络跃点并针对最短延迟时间进行优化。此外，Cluster Director 还提供可用于作业布置的节点级和集群级拓扑信息。

A4X 机器类型

A4X 加速器优化型机器类型使用 NVIDIA GB200 Grace Blackwell 超级芯片 (nvidia-gb200)，非常适合基础模型训练和部署。

A4X 是基于 NVIDIA GB200 NVL72 的艾级平台。每台机器都有两个搭载了 Arm Neoverse V2 核心的 NVIDIA Grace CPU 插槽。这些 CPU 通过快速芯片间 (NVLink-C2C) 通信连接到四个 NVIDIA B200 Blackwell GPU。

						挂接了 NVIDIA GB200 Grace Blackwell 超级芯片
机器类型	vCPU 数量¹	实例内存 (GB)	已挂接的本地 SSD (GiB)	物理 NIC 数量	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB HBM3e)
`a4x-highgpu-4g`	140	884	12,000	6	2,000	4	720

¹每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
² 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽，请参阅网络带宽。
³GPU 内存是 GPU 设备上的内存，可用于临时存储数据。它与实例的内存分开，专门用于处理图形密集型工作负载的更高带宽需求。

A4X 限制

只能使用 A4X 机器类型支持的使用选项来请求容量。
使用 A4X 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在某些区域和可用区中使用 A4X 机器类型。
不能在使用 A4X 机器类型的实例上使用永久性磁盘（区域级或可用区级）。
A4X 机器类型仅在 NVIDIA Grace 平台上提供。
不能将现有实例的机器类型更改为 A4X 机器类型；只能创建新的 A4X 虚拟机。使用 A4X 机器类型创建实例后，便无法再更改机器类型。
不能在 A4X 机器类型上运行 Windows 操作系统。
A4X 实例不支持以下各项：
- 单租户
- Spot 虚拟机

A4X 实例支持的磁盘类型

A4X 实例可以使用以下块存储类型：

Hyperdisk Balanced (hyperdisk-balanced)：这是启动磁盘支持的唯一磁盘类型
Hyperdisk Extreme (hyperdisk-extreme)
本地 SSD：自动添加到使用任何 A4X 机器类型创建的实例

每个实例的磁盘数量上限¹
机器类型	所有 Hyperdisk	平衡 Hyperdisk	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	挂接了本地 SSD
`a4x-highgpu-4g`	128	128	不适用	不适用	8	32

¹Hyperdisk 用量与机器类型是分开计费的。如需了解磁盘价格，请参阅 Hyperdisk 价格。

磁盘和容量限制

您可以将不同类型的 Hyperdisk 混合挂接到实例，但所有磁盘类型的磁盘总容量上限（以 TiB 为单位）不能超过 512 TiB（对于所有 Hyperdisk）。

如需详细了解容量限制，请参阅 Hyperdisk 大小和连接限制。

A4 机器系列

A4 机器系列提供配备多达 224 个 vCPU 和 3,968 GB 内存的机器类型。对于大多数 GPU 加速工作负载，A4 实例提供的性能是先前的 GPU 实例类型的 3 倍。建议将 A4 用于机器学习训练工作负载，尤其是在大规模场景（例如使用数百或数千个 GPU）。A4 机器系列提供一种机器类型。

使用 A4 机器类型创建的虚拟机实例具有以下特性：

通过 NVIDIA B200 GPU 实现 GPU 加速：NVIDIA B200 GPU 会自动挂接到 A4 实例，每个 GPU 提供 180 GB GPU 内存。
第 5 代 Intel Xeon 可扩缩处理器 (Emerald Rapids)：可提供高达 4.0 GHz 的持续单核最大 Turbo 频率。如需详细了解此处理器，请参阅 CPU 平台。
业界领先的 NVLink 可伸缩性：NVIDIA B200 GPU 为每个 GPU 双向提供 1,800 GBps 的 GPU NVLink 带宽。

得益于系统中的 8 个 GPU 之间采用全连接 NVLink 拓扑，总 NVLink 带宽可高达 14.4 TBps。
通过 RoCE 增强网络性能：RDMA over Converged Ethernet (RoCE) 通过将 NVIDIA ConnectX-7 网络接口卡 (NIC) 与 Google 的数据中心级四向轨道对齐的网络相结合，可提高网络性能。与大多数 A3 实例相比，通过利用 RDMA over Converged Ethernet (RoCE)，A4 实例可在集群中的实例之间实现更高的吞吐量，但在 A3 Ultra 机器类型上运行的实例除外。

注意：由于网络拓扑不同，您无法在 A4 实例与使用任何上一代加速器优化机器系列创建的实例之间移动工作负载。您只能在运行于 A4 和 A3 Ultra 机器类型上的实例之间移动工作负载。
提升了网络速度：网络速度是上一代 A2 实例的 4 倍。

如需详细了解网络，请参阅网络带宽和 GPU。
针对数据传输和恢复优化了虚拟化：A4 实例的外设组件互连高速总线 (PCIe) 拓扑可提供更准确的位置信息，工作负载可使用这些信息来优化数据传输。

GPU 还公开了功能级重置 (FLR)，可从故障中正常恢复，并在某些情况下提供原子操作支持，可实现并发改进。
本地 SSD 和 Hyperdisk 支持：12,000 GiB 的本地 SSD 会自动添加到 A4 实例。本地 SSD 可用于快速 scratch 磁盘或用于将数据输送到 GPU 中，同时防止 I/O 瓶颈。

对于需要更高存储性能的应用，您还可以为 A4 实例挂接高达 512 TiB 的 Hyperdisk。
密集分配和拓扑感知调度支持：在预配使用 Cluster Director 提供的功能和服务的 A4 实例时，您可以请求密集分配的容量块。宿主机在物理上彼此靠近，并作为资源块预配，并通过动态机器学习网络结构相互连接，以最大限度地减少网络跃点并针对最短延迟时间进行优化。此外，您还可以在节点和集群级层获取可用于作业布置的拓扑信息。

A4 机器类型

A4 加速器优化型机器类型挂接了 NVIDIA B200 Blackwell GPU (nvidia-b200)，非常适合基础模型训练和部署。

						挂接了 NVIDIA B200 Blackwell GPU
机器类型	vCPU 数量¹	实例内存 (GB)	已挂接的本地 SSD (GiB)	物理 NIC 数量	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB HBM3e)
`a4-highgpu-8g`	224	3,968	12,000	10	3600	8	1,440

A4 限制

只能使用 A4 机器类型支持的使用选项来请求容量。
使用 A4 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在某些区域和可用区中使用 A4 机器类型。
不能在使用 A4 机器类型的实例上使用永久性磁盘（区域级或可用区级）。
A4 机器类型仅在 Emerald Rapids CPU 平台上提供。
不能将现有实例的机器类型更改为 A4 机器类型；只能创建新的 A4 实例。使用 A4 机器类型创建实例后，便无法再更改机器类型。
A4 机器类型不支持单租户。
不能在 A4 机器类型上运行 Windows 操作系统。

A4 实例支持的磁盘类型

A4 实例可以使用以下块存储类型：

Hyperdisk Balanced (hyperdisk-balanced)：这是启动磁盘支持的唯一磁盘类型
Hyperdisk Extreme (hyperdisk-extreme)
本地 SSD：自动添加到使用任何 A4 机器类型创建的实例

每个实例的磁盘数量上限¹
机器类型	所有 Hyperdisk	平衡 Hyperdisk	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	挂接了本地 SSD
`a4-highgpu-8g`	128	128	不适用	不适用	8	32

¹Hyperdisk 用量与机器类型是分开计费的。如需了解磁盘价格，请参阅 Hyperdisk 价格。

磁盘和容量限制

您可以将不同类型的 Hyperdisk 混合挂接到实例，但所有磁盘类型的磁盘总容量上限（以 TiB 为单位）不能超过 512 TiB（对于所有 Hyperdisk）。

如需详细了解容量限制，请参阅 Hyperdisk 大小和连接限制。

A3 机器系列

A3 机器系列最多配有 224 个 vCPU 和 2,944 GB 内存。此机器系列针对计算和内存密集型、网络绑定机器学习训练和 HPC 工作负载进行了优化。 A3 机器系列提供 A3 Ultra、A3 Mega、A3 High 和 A3 Edge 机器类型。

使用 A3 机器类型创建的虚拟机实例具有以下特性：

功能	A3 Ultra	A3 Mega、A3 High、A3 Edge
GPU 加速	挂接了 NVIDIA H200 SXM GPU，每个 GPU 提供 141 GB GPU 内存，并提供更大、更快的内存，可支持大型语言模型和 HPC 工作负载。	挂接了 NVIDIA H100 SXM GPU，每个 GPU 提供 80 GB GPU 内存，非常适合基于 Transformer 的大语言模型、数据库和 HPC。
Intel Xeon 可扩缩处理器	第 5 代 Intel Xeon 可扩展处理器 (Emerald Rapids)，可提供高达 4.0 GHz 的持续单核最大 Turbo 频率。如需详细了解此处理器，请参阅 CPU 平台。	第 4 代 Intel Xeon 可扩缩处理器 (Sapphire Rapids)，可提供高达 3.3 GHz 的持续单核最大 Turbo 频率。如需详细了解此处理器，请参阅 CPU 平台。
业界领先的 NVLink 可伸缩性	NVIDIA H200 GPU 提供单向 900 GB/s 的峰值 GPU NVLink 带宽。得益于系统中的 8 个 GPU 之间采用全连接 NVLink 拓扑，总 NVLink 带宽可高达 7.2 TB/s。	NVIDIA H100 GPU 提供单向 450 GB/s 的峰值 GPU NVLink 带宽。得益于系统中的 8 个 GPU 之间采用全连接 NVLink 拓扑，总 NVLink 带宽可高达 7.2 TB/s。
增强了网络性能	对于此机器类型，RDMA over Converged Ethernet (RoCE) 通过将 NVIDIA ConnectX-7 网络接口卡 (NIC) 与我们的数据中心级四向轨道对齐网络相结合，可提高网络性能。与其他 A3 机器类型相比，通过利用 RDMA over Converged Ethernet (RoCE)，`a3-ultragpu-8g` 机器类型可在集群中的实例之间实现更高的吞吐量。注意：由于 A3 Ultra 与先前的 A3 系列（A3 Mega、A3 High 和 A3 Edge）的网络拓扑不同，因此您无法在运行于 A3 Ultra 和先前的 A3 系列上的实例之间移动工作负载。	对于 A3 Mega 机器类型，GPUDirect-TCPXO 通过将 TCP 协议分流，可进一步改进 GPUDirect-TCPX。通过利用 GPUDirect-TCPXO，`a3-megagpu-8g` 机器类型的网络带宽是 A3 High 和 A3 Edge 机器类型的两倍。对于 A3 Edge 和 A3 High 机器类型，GPUDirect-TCPX 可让数据包载荷直接从 GPU 内存传输到网络接口，从而提高网络性能。与 A2 或 G2 加速器优化机器类型相比，通过利用 GPUDirect-TCPX，这些机器类型可在集群中的实例之间实现更高的吞吐量。
提升了网络速度	网络速度是上一代 A2 机器系列的 4 倍。如需详细了解网络，请参阅网络带宽和 GPU。	网络速度是上一代 A2 机器系列的 2.5 倍。如需详细了解网络，请参阅网络带宽和 GPU。
虚拟化优化	A3 实例的外设组件互连高速总线 (PCIe) 拓扑可提供更准确的位置信息，工作负载可使用这些信息来优化数据传输。 GPU 还公开了功能级重置 (FLR)，可从故障中正常恢复，并在某些情况下提供原子操作支持，可实现并发改进。
本地 SSD、永久性磁盘和 Hyperdisk 支持	本地 SSD 可用于快速 scratch 磁盘或用于将数据输送到 GPU 中，同时防止 I/O 瓶颈。本地 SSD 按以下方式挂接： 12,000 GiB 的本地 SSD 会自动添加到 A3 Ultra 实例。 6,000 GiB 的本地 SSD 会自动添加到 A3 Mega、A3 High 和 A3 Edge 实例。对于需要更高存储性能的应用，您还可以为这些系列中的机器类型挂接高达 512 TiB 的永久性磁盘和 Hyperdisk。对于部分机器类型，还支持高达 257 TiB 的永久性磁盘。
紧凑布置政策支持	可让您更好地控制实例在数据中心内的物理布置。这样可以在单个可用区中为实例布置提供低延迟和更高的带宽。如需了解详情，请参阅紧凑布置政策简介。注意：默认情况下，您无法将包含距离最大值的紧凑布置政策应用于 Compute Engine 中的 A3 虚拟机。如需申请使用此功能，请与您的专属技术支持客户经理 (TAM) 或销售团队联系。

A3 Ultra 机器类型

A3 Ultra 机器类型挂接了 NVIDIA H200 SXM GPU (nvidia-h200-141gb)，是 A3 系列中能够提供最高网络性能的机器类型。A3 Ultra 机器类型非常适合基础模型训练和部署。

						挂接了 NVIDIA H200 GPU
机器类型	vCPU 数量¹	实例内存 (GB)	已挂接的本地 SSD (GiB)	物理 NIC 数量	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB HBM3e)
`a3-ultragpu-8g`	224	2,952	12,000	10	3600	8	1128

A3 Ultra 限制

只能使用 A3 Ultra 机器类型支持的使用选项来请求容量。
使用 A3 Ultra 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在某些区域和可用区中使用 A3 Ultra 机器类型。
不能在使用 A3 Ultra 机器类型的实例上使用永久性磁盘（区域级或可用区级）。
A3 Ultra 机器类型仅在 Emerald Rapids CPU 平台上提供。
不能将现有实例的机器类型更改为 A3 Ultra 机器类型；只能创建新的 A3 Ultra 实例。使用 A3 Ultra 机器类型创建实例后，便无法再更改机器类型。
A3 Ultra 机器类型不支持单租户。
不能在 A3 Ultra 机器类型上运行 Windows 操作系统。

A3 Mega 机器类型

A3 Mega 机器类型配备 NVIDIA H100 SXM GPU，非常适合大型模型训练和多主机推理。

提示：在预配 a3-megagpu-8g 机器类型时，建议使用这些实例的集群，并使用 Google Kubernetes Engine (GKE) 或 Slurm 等调度器进行部署。如需详细了解任一选项，请查看以下内容：

如需创建 Google Kubernetes Engine 集群，请参阅使用 GKE 部署 A3 Mega 集群。
如需创建 Slurm 集群，请参阅部署 A3 Mega Slurm 集群。

						挂接了 NVIDIA H100 GPU
机器类型	vCPU 数量¹	实例内存 (GB)	已挂接的本地 SSD (GiB)	物理 NIC 数量	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB HBM3)
`a3-megagpu-8g`	208	1,872	6000	9	1800	8	640

A3 Mega 限制

只能使用 A3 Mega 机器类型支持的使用选项来请求容量。
使用 A3 Mega 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在某些区域和可用区中使用 A3 Mega 机器类型。
不能在使用 A3 Mega 机器类型的实例上使用区域级永久性磁盘。
A3 Mega 机器类型仅在 Sapphire Rapids CPU 平台上提供。
不能将现有实例的机器类型更改为 A3 Mega 机器类型；只能创建新的 A3 Mega 实例。使用 A3 Mega 机器类型创建实例后，便无法再更改机器类型。
A3 Mega 机器类型不支持单租户。
不能在 A3 Mega 机器类型上运行 Windows 操作系统。

A3 High 机器类型

A3 High 机器类型配备 NVIDIA H100 SXM GPU，非常适合大型模型推理和模型微调。

提示：在预配 a3-highgpu-1g、a3-highgpu-2g 或 a3-highgpu-4g 机器类型时，您必须使用 Spot 虚拟机或通过利用动态工作负载调度器 (DWS) 的功能（例如 MIG 中的规模调整请求）来创建实例。如需详细了解任一选项，请查看以下内容：

如需创建 Spot 虚拟机，请在创建加速器优化虚拟机时将预配模型设置为 SPOT。
如需在 MIG 中创建使用 DWS 的规模调整请求，请参阅创建具有 GPU 虚拟机的 MIG。

						挂接了 NVIDIA H100 GPU
机器类型	vCPU 数量¹	实例内存 (GB)	已挂接的本地 SSD (GiB)	物理 NIC 数量	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB HBM3)
`a3-highgpu-1g`	26	234	750	1	25	1	80
`a3-highgpu-2g`	52	468	1,500	1	50	2	160
`a3-highgpu-4g`	104	936	3000	1	100	4	320
`a3-highgpu-8g`	208	1,872	6000	5	1000	8	640

A3 High 限制

只能使用 A3 High 机器类型支持的使用选项来请求容量。
使用 A3 High 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在某些区域和可用区中使用 A3 High 机器类型。
不能在使用 A3 High 机器类型的实例上使用区域级永久性磁盘。
A3 High 机器类型仅在 Sapphire Rapids CPU 平台上提供。
不能将现有实例的机器类型更改为 A3 High 机器类型；只能创建新的 A3 High 实例。使用 A3 High 机器类型创建实例后，便无法再更改机器类型。
A3 High 机器类型不支持单租户。
不能在 A3 High 机器类型上运行 Windows 操作系统。
对于 a3-highgpu-1g、a3-highgpu-2g 和 a3-highgpu-4g 机器类型，必须使用 Spot 虚拟机或通过利用动态工作负载调度器 (DWS) 的功能（例如 MIG 中的规模调整请求）来创建实例。如需详细了解任一选项，请查看以下内容：
- 如需创建 Spot 虚拟机，请在创建加速器优化虚拟机时将预配模型设置为 SPOT。
- 如需在 MIG 中创建使用 DWS 的规模调整请求，请参阅创建具有 GPU 虚拟机的 MIG。
您只能在有限的区域和可用区中使用具有 a3-highgpu-1g 机器类型的机密虚拟机，并且适用于在 A3 High 机器类型上运行的机密虚拟机的所有限制也适用。

A3 Edge 机器类型

A3 Edge 机器类型配备 NVIDIA H100 SXM GPU，专为部署而设计，在部分区域提供。

						挂接了 NVIDIA H100 GPU
机器类型	vCPU 数量¹	实例内存 (GB)	已挂接的本地 SSD (GiB)	物理 NIC 数量	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB HBM3)
`a3-edgegpu-8g`	208	1,872	6000	5	800：适用于 asia-south1 和 northamerica-northeast2 400：适用于所有其他 A3 Edge 区域	8	640

A3 Edge 限制

只能使用 A3 Edge 机器类型支持的使用选项来请求容量。
使用 A3 Edge 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在某些区域和可用区中使用 A3 Edge 机器类型。
不能在使用 A3 Edge 机器类型的实例上使用区域级永久性磁盘。
A3 Edge 机器类型仅在 Sapphire Rapids CPU 平台上提供。
不能将现有实例的机器类型更改为 A3 Edge 机器类型；只能创建新的 A3 Edge 实例。使用 A3 Edge 机器类型创建实例后，便无法再更改机器类型。
A3 Edge 机器类型不支持单租户。
不能在 A3 Edge 机器类型上运行 Windows 操作系统。

A3 实例支持的磁盘类型

A3 Ultra

A3 Ultra 实例可以使用以下块存储类型：

Hyperdisk Balanced (hyperdisk-balanced)：这是启动磁盘支持的唯一磁盘类型
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk Extreme (hyperdisk-extreme)
本地 SSD：自动添加到使用任何 A3 机器类型创建的实例

每个实例的磁盘数量上限¹
机器类型	所有 Hyperdisk	平衡 Hyperdisk	Hyperdisk Balanced High Availability	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	挂接了本地 SSD 磁盘
`a3-ultragpu-8g`	128	128	128	不适用	不适用	8	32

¹Hyperdisk 用量与机器类型是分开计费的。如需了解磁盘价格，请参阅 Hyperdisk 价格。

A3 Mega

A3 Mega 实例可以使用以下块存储类型：

平衡永久性磁盘 (pd-balanced)
SSD（性能）永久性磁盘 (pd-ssd)
Hyperdisk Balanced (hyperdisk-balanced)
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Extreme (hyperdisk-extreme)
Hyperdisk Throughput (hyperdisk-throughput)
本地 SSD：自动添加到使用任何 A3 机器类型创建的实例

每个实例的磁盘数量上限¹
机器类型	所有 Hyperdisk	平衡 Hyperdisk	Hyperdisk Balanced High Availability	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	挂接了本地 SSD 磁盘
`a3-megagpu-8g`	128	32	32	64	64	8	16

¹Hyperdisk 和永久性磁盘用量与机器类型是分开计费的。如需了解磁盘价格，请参阅永久性磁盘和 Hyperdisk 价格。

A3 High

A3 High 实例可以使用以下块存储类型：

平衡永久性磁盘 (pd-balanced)
SSD（性能）永久性磁盘 (pd-ssd)
Hyperdisk Balanced (hyperdisk-balanced)
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Extreme (hyperdisk-extreme)
Hyperdisk Throughput (hyperdisk-throughput)
本地 SSD：自动添加到使用任何 A3 机器类型创建的实例

每个实例的磁盘数量上限¹
机器类型	所有 Hyperdisk	平衡 Hyperdisk	Hyperdisk Balanced High Availability	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	挂接了本地 SSD 磁盘
`a3-highgpu-1g`	128	32	32	64	64	不适用	2
`a3-highgpu-2g`	128	32	32	64	64	不适用	4
`a3-highgpu-4g`	128	32	32	64	64	8	8
`a3-highgpu-8g`	128	32	32	64	64	8	16

¹Hyperdisk 和永久性磁盘用量与机器类型是分开计费的。如需了解磁盘价格，请参阅永久性磁盘和 Hyperdisk 价格。

A3 Edge

A3 Edge 实例可以使用以下块存储类型：

平衡永久性磁盘 (pd-balanced)
SSD（性能）永久性磁盘 (pd-ssd)
Hyperdisk Balanced (hyperdisk-balanced)
Hyperdisk Balanced High Availability (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Extreme (hyperdisk-extreme)
Hyperdisk Throughput (hyperdisk-throughput)
本地 SSD：自动添加到使用任何 A3 机器类型创建的实例

每个实例的磁盘数量上限¹
机器类型	所有 Hyperdisk	平衡 Hyperdisk	Hyperdisk Balanced High Availability	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	挂接了本地 SSD
`a3-edgegpu-8g`	128	32	32	64	64	8	16

¹Hyperdisk 和永久性磁盘用量与机器类型是分开计费的。如需了解磁盘价格，请参阅永久性磁盘和 Hyperdisk 价格。

磁盘和容量限制

如果机器类型支持，您可以同时将 Hyperdisk 卷和永久性磁盘卷挂接到实例，但存在以下限制：

每个实例的 Hyperdisk 卷和永久性磁盘卷的总数不能超过 128 个。
所有磁盘类型的磁盘总容量上限（以 TiB 为单位）不能超过以下值：
- 对于 vCPU 数量少于 32 个的机器类型：
  - 对于所有 Hyperdisk 或所有 Persistent Disk 为 257 TiB
  - 对于 Hyperdisk 和 Persistent Disk 的混合使用为 257 TiB
- 对于具有 32 个或更多 vCPU 的机器类型：
  - 对于所有 Hyperdisk 为 512 TiB
  - 对于 Hyperdisk 和 Persistent Disk 的混合使用为 512 TiB
  - 对于所有 Persistent Disk 为 257 TiB

如需详细了解容量限制，请参阅 Hyperdisk 大小和连接限制以及 Persistent Disk 容量上限。

A2 机器系列

A2 机器系列提供 A2 Standard 和 A2 Ultra 机器类型。这些机器类型具有 12 个到 96 个 vCPU 和高达 1,360 GB 的内存。

使用 A2 机器类型创建的虚拟机实例具有以下特性：

GPU 加速：每个 A2 实例都配有 NVIDIA A100 GPU。有 A100 40GB 和 A100 80GB 可供选择。
行业领先的 NVLink 容量，GPU 到 GPU NVLink 峰值带宽为 600 GBps。例如，具有 16 个 GPU 的系统的总 NVLink 带宽高达 9.6 TBps。这 16 个 GPU 可用作具有统一内存空间的单个高性能加速器，可提供高达每秒 10 千万亿次浮点运算的计算能力和每秒 20 千万亿次浮点运算的推断计算能力，可用于人工智能、深度学习和机器学习工作负载。
提升了计算速度：挂接的 NVIDIA A100 GPU 提供的计算速度提是上一代 NVIDIA V100 GPU 的 10 倍。

使用 A2 机器系列，您可以获得高达 100 Gbps 的网络带宽。
本地 SSD、永久性磁盘和 Hyperdisk 支持：为了用于快速 scratch 磁盘或将数据输送到 GPU，同时防止 I/O 瓶颈，A2 机器类型支持本地 SSD，如下所示：
- 对于 A2 Standard 机器类型，您可以在创建实例时添加高达 3,000 GiB 的本地 SSD。
- 对于 A2 Ultra 机器类型，在您创建实例时，会自动挂接本地 SSD。
对于需要更高存储性能的应用，您还可以为 A2 实例挂接高达 257 TiB 的永久性磁盘和 512 TiB 的 Hyperdisk 卷。
紧凑布置政策支持：可让您更好地控制实例在数据中心内的物理布置。这样可以在单个可用区中为实例布置提供低延迟和更高的带宽。如需了解详情，请参阅使用紧凑布置政策缩短延迟时间。

A2 机器系列提供以下机器类型。

A2 Ultra 机器类型

这些机器类型具有固定数量的 A100 80GB GPU。本地 SSD 会自动挂接到使用 A2 Ultra 机器类型创建的实例。

					挂接了 NVIDIA A100 80GB GPU
机器类型	vCPU 数量¹	实例内存 (GB)	已挂接的本地 SSD (GiB)	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB HBM2e)
`a2-ultragpu-1g`	12	170	375	24	1	80
`a2-ultragpu-2g`	24	340	750	32	2	160
`a2-ultragpu-4g`	48	680	1500	50	4	320
`a2-ultragpu-8g`	96	1,360	3000	100	8	640

A2 Ultra 限制

只能使用 A2 Ultra 机器类型支持的使用选项来请求容量。
使用 A2 Ultra 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在某些区域和可用区中使用 A2 Ultra 机器类型。
A2 Ultra 机器类型仅在 Cascade Lake 平台上提供。
如果实例使用 A2 Ultra 机器类型，则不能更改机器类型。如果您需要使用其他 A2 Ultra 机器类型或任何其他机器类型，则必须创建新实例。
不能将任何其他机器类型更改为 A2 Ultra 机器类型。如果您需要使用 A2 Ultra 机器类型的实例，则必须创建新实例。
不能在使用 A2 Ultra 机器类型的 Windows 实例上快速格式化挂接的本地 SSD。如需设置这些本地 SSD 的格式，您必须使用 diskpart 实用程序并指定 format fs=ntfs label=tmpfs 设置，以进行完整格式化。

A2 标准机器类型

这些机器类型具有固定数量的 A100 40GB GPU。您还可以在创建 A2 Standard 实例时添加本地 SSD 磁盘。如需了解可挂接的磁盘数量，请参阅需要您选择本地 SSD 磁盘数量的机器类型。

					挂接了 NVIDIA A100 40GB GPU
机器类型	vCPU 数量¹	实例内存 (GB)	支持本地 SSD	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB HBM2)
`a2-highgpu-1g`	12	85	是	24	1	40
`a2-highgpu-2g`	24	170	是	32	2	80
`a2-highgpu-4g`	48	340	是	50	4	160
`a2-highgpu-8g`	96	680	是	100	8	320
`a2-megagpu-16g`	96	1,360	是	100	16	640

A2 Standard 限制

只能使用 A2 Standard 机器类型支持的使用选项来请求容量。
使用 A2 Standard 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在某些区域和可用区中使用 A2 标准机器类型。
A2 标准机器类型仅在 Cascade Lake 平台上提供。
如果实例使用 A2 Standard 机器类型，则您只能从一种 A2 Standard 机器类型切换到另一种 A2 Standard 机器类型。您无法切换到任何其他机器类型。如需了解详情，请参阅修改加速器优化型实例。
不能将 Windows 操作系统与 a2-megagpu-16g A2 Standard 机器类型搭配使用。使用 Windows 操作系统时，请选择其他 A2 Standard 机器类型。
不能在使用 A2 Standard 机器类型的 Windows 实例上快速格式化挂接的本地 SSD。如需设置这些本地 SSD 的格式，您必须使用 diskpart 实用程序并指定 format fs=ntfs label=tmpfs 设置，以进行完整格式化。
A2 标准机器类型不支持单租户。

A2 实例支持的磁盘类型

A2 实例可以使用以下块存储类型：

Hyperdisk ML (hyperdisk-ml)
平衡永久性磁盘 (pd-balanced)
SSD（性能）永久性磁盘 (pd-ssd)
标准永久性磁盘 (pd-standard)
本地 SSD：自动挂接到使用 A2 Ultra 机器类型创建的实例。

如果机器类型支持，您可以同时将 Hyperdisk 卷和永久性磁盘卷挂接到实例，但存在以下限制：

每个实例的 Hyperdisk 卷和永久性磁盘卷的总数不能超过 128 个。
所有磁盘类型的磁盘总容量上限（以 TiB 为单位）不能超过以下值：
- 对于 vCPU 数量少于 32 个的机器类型：
  - 对于所有 Hyperdisk 或所有 Persistent Disk 为 257 TiB
  - 对于 Hyperdisk 和 Persistent Disk 的混合使用为 257 TiB
- 对于具有 32 个或更多 vCPU 的机器类型：
  - 对于所有 Hyperdisk 为 512 TiB
  - 对于 Hyperdisk 和 Persistent Disk 的混合使用为 512 TiB
  - 对于所有 Persistent Disk 为 257 TiB

如需详细了解容量限制，请参阅 Hyperdisk 大小和连接限制以及 Persistent Disk 容量上限。

G4 机器系列

G4 机器系列使用 AMD EPYC Turin CPU 平台，并配备 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU。与上一代 G2 机器系列相比，此机器系列在 GPU 内存、GPU 内存带宽和网络带宽方面都有显著改进。

G4 实例最多可以挂接 384 个 vCPU、1,440 GB 内存和 12 TiB 的 Titanium SSD 磁盘。G4 实例还提供高达 400 Gbps 的标准网络性能。

此机器系列特别适用于 NVIDIA Omniverse 模拟工作负载、图形密集型应用、视频转码和虚拟桌面等工作负载。与 A 系列机器类型相比，G4 机器系列还提供了一种低成本解决方案来执行单主机推理和模型调优。

使用 G4 机器类型的实例具有以下特性：

通过 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU 实现 GPU 加速：G4 实例会自动挂接 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU，每个 GPU 提供 96 GB GPU 内存。
第 5 代 AMD EPYC Turin CPU 平台：此平台可提供高达 4.1 GHz 的持续最大提升频率。如需详细了解此处理器，请参阅 CPU 平台。
下一代图形性能：与挂接到 G2 机器系列的 NVIDIA L4 GPU 相比，NVIDIA RTX PRO 6000 GPU 在性能和功能方面都有显著提升。这些升级如下：
- 第 5 代 Tensor 核心：这些核心引入了对 FP4 精度和 DLSS 4 多帧生成的支持。与 NVIDIA L4 GPU 相比，NVIDIA RTX PRO 6000 GPU 通过使用这些第 5 代 Tensor 核心，可提供更高的性能，从而加速本地 LLM 开发和内容创作等任务。
- 第 4 代 RT 核心：这些核心提供的光线追踪性能是上一代 NVIDIA L4 GPU 的两倍，可加速设计和制造工作负载的渲染。
- 核心数：NVIDIA RTX PRO 6000 GPU 包含 24,064 个 CUDA 核心、752 个第 5 代 Tensor 核心和 188 个第 4 代 RT 核心。与前几代（例如 L4 GPU，具有 7,680 个 CUDA 核心和 240 个 Tensor 核心）相比，此更新显著提升了性能。
多实例 GPU (MIG)：此功能可将单个 GPU 划分为单个虚拟机实例上最多四个完全隔离的 GPU 实例。如需详细了解 NVIDIA MIG，请参阅 NVIDIA 文档中的 NVIDIA 多实例 GPU。
支持第 5 代 Peripheral Component Interconnect Express (PCIe)：G4 实例支持第 5 代 PCI Express，与 G2 实例使用的第 3 代 PCIe 相比，可提高从 CPU 内存到 GPU 的数据传输速度。
支持 Titanium SSD 和 Hyperdisk：G4 实例支持挂接高达 12,000 GiB 的 Titanium SSD。Titanium SSD 可提供快速 scratch 磁盘或将数据输送到 GPU 中，有助于避免 I/O 瓶颈。

对于需要更高存储性能的应用，G4 实例还支持挂接高达 512 TiB 的 Hyperdisk。
GPU 点对点 (P2P) 通信：G4 实例支持 GPU P2P 通信，可在同一实例内的 GPU 之间直接传输数据。这可以减少数据传输延迟时间并释放 CPU 资源，从而显著提升多 GPU 工作负载的性能。如需了解详情，请参阅 G4 GPU 点对点 (P2P) 通信。

G4 机器类型

G4 加速器优化型机器类型使用 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU (nvidia-rtx-pro-6000)，适用于 NVIDIA Omniverse 模拟工作负载、图形密集型应用、视频转码和虚拟桌面。与 A 系列机器类型相比，G4 机器类型还提供了一种低成本解决方案来执行单主机推理和模型调优。

						挂接了 NVIDIA RTX PRO 6000 GPU
机器类型	vCPU 数量¹	实例内存 (GB)	支持的最大 Titanium SSD (GiB)²	物理 NIC 数量	网络带宽上限 (Gbps)³	GPU 数量	GPU 内存⁴ (GB GDDR7)
`g4-standard-48`	48	180	1,500	1	50	1	96
`g4-standard-96`	96	360	3000	1	100	2	192
`g4-standard-192`	192	720	6000	1	200	4	384
`g4-standard-384`	384	1,440	12,000	2	400	8	768

¹每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
²您可以在创建 G4 实例时添加 Titanium SSD 磁盘。如需了解可挂接的磁盘数量，请参阅需要您选择本地 SSD 磁盘数量的机器类型。
³出站带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。请参阅网络带宽。
⁴GPU 内存是 GPU 设备上的内存，可用于临时存储数据。它与实例的内存分开，专门用于处理图形密集型工作负载的更高带宽需求。

G4 限制

只能使用 G4 机器类型支持的使用选项来请求容量。
使用 G4 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在部分区域和可用区使用 G4 机器类型。
不能在使用 G4 机器类型的实例上使用永久性磁盘（区域级或可用区级）。
G4 机器类型仅在 AMD EPYC Turin 第 5 代平台上提供。
只能创建按需实例。不支持预留、灵活启动或 Spot 虚拟机。如需开始使用 G4 实例，请与您的 Google 客户支持团队联系。
只能在 us-central1-b 中创建 G4 实例。
只能在采用 G4 机器类型的实例上使用 Hyperdisk Balanced 和 Hyperdisk Extreme 磁盘类型。
不能将承诺使用折扣应用于使用 G4 机器类型的实例。
不能创建使用 G4 机器类型的机密虚拟机实例。
不能在单租户节点上创建 G4 实例。
不能创建使用 NVIDIA RTX 虚拟工作站 (vWS) 的 G4 实例。

G4 实例支持的磁盘类型

G4 实例可以使用以下块存储类型：

Hyperdisk Balanced (hyperdisk-balanced)
Hyperdisk Extreme (hyperdisk-extreme)
Titanium SSD：您可以将 Titanium SSD 添加到使用 G4 机器类型创建的实例。

每个实例的磁盘数量上限¹
机器类型	所有 Hyperdisk	平衡 Hyperdisk	Hyperdisk Extreme	Titanium SSD
`g4-standard-48`	32	32	0	4
`g4-standard-96`	32	32	8	8
`g4-standard-192`	64	64	8	16
`g4-standard-384`	128	128	8	32

¹Hyperdisk 用量与机器类型是分开计费的。如需了解磁盘价格，请参阅 Hyperdisk 价格。

您可以将不同类型的 Hyperdisk 混合挂接到实例，但所有磁盘类型的磁盘总容量上限（以 TiB 为单位）不能超过 512 TiB（对于所有 Hyperdisk）。

如需详细了解容量限制，请参阅 Hyperdisk 大小和连接限制。

G4 点对点 (P2P) 通信

G4 实例使用直接 GPU 点对点 (P2P) 通信来提升多 GPU 工作负载性能。此功能使挂接到同一 G4 实例的 GPU 可以直接通过 PCIe 总线交换数据，而无需通过 CPU 的主内存传输数据。此直接路径可缩短延迟时间、降低 CPU 利用率并提高 GPU 之间的有效带宽。P2P 通信可显著加速机器学习 (ML) 训练和高性能计算 (HPC) 等多 GPU 应用。

此功能通常不需要修改应用代码。您只需配置 NCCL 即可使用 P2P。如需配置 NCCL，请在运行工作负载之前，根据机器类型在 G4 实例上设置 NCCL_P2P_LEVEL 环境变量：

对于具有 2 个或 4 个 GPU 的 G4 实例（g4-standard-96、g4-standard-192）：请设置 NCCL_P2P_LEVEL=PHB
对于具有 8 个 GPU 的 G4 实例 (g4-standard-384)：请设置 NCCL_P2P_LEVEL=SYS

使用以下任一选项设置环境变量：

在命令行中，在您计划运行应用的 shell 会话中运行相应的导出命令（例如 export NCCL_P2P_LEVEL=SYS）。如需使此设置持久存在，请将此命令添加到 shell 的启动脚本（例如 ~/.bashrc）中。
将适当的设置（例如 NCCL_P2P_LEVEL=SYS）添加到位于 /etc/nccl.conf 的 NCCL 配置文件中。

主要优势和性能

在具有两个或更多 GPU 的 G4 实例上加速多 GPU 工作负载：为在 g4-standard-96、g4-standard-192 和 g4-standard-384 机器类型上运行的应用提供更快的运行时。
提供高带宽通信：在 GPU 之间实现较高的数据传输速度。
提升 NCCL 性能：与不使用 P2P 的通信相比，可显著提升使用 NVIDIA Collective Communication Library (NCCL) 的应用的性能。Google 的 Hypervisor 可安全地在实例中隔离这种 P2P 通信。
- 在 4 个 GPU 实例 (g4-standard-192) 上，所有 GPU 都位于单个 NUMA 节点上，从而可实现最高效的 P2P 通信。这可使 Allgather、Allreduce 和 ReduceScatter 等集合的性能提升到原来的 2.04 倍。
- 在 8 个 GPU 实例 (g4-standard-384) 上，GPU 分布在两个 NUMA 节点上。对于这些节点内部和节点之间的流量，P2P 通信速度均有所提升，对于相同的集合，性能提升到原来的 2.19 倍。

G2 机器系列

G2 机器系列提供标准机器类型，具有 4 到 96 个 vCPU 和高达 432 GB 的内存。此机器系列针对推断和图形工作负载进行了优化。 G2 机器系列提供一种标准机器类型，但有多种配置可供选择。

使用 G2 机器类型创建的实例具有以下特性：

GPU 加速：每种 G2 机器类型都配有 NVIDIA L4 GPU。
提高了推理速率：G2 机器类型提供对 FP8（8 位浮点）数据类型的支持，可加快机器学习推理速率并降低内存需求。
下一代图形性能：NVIDIA L4 GPU 使用第三代 RT 核心和 NVIDIA DLSS 3（深度学习超级采样）技术将图形性能提升到 3 倍。
高性能网络带宽：使用 G2 机器系列，您可以获得高达 100 Gbps 的网络带宽。
本地 SSD、永久性磁盘和 Hyperdisk 支持：您可以为 G2 实例添加高达 3,000 GiB 的本地 SSD。可用于快速 scratch 磁盘或用于将数据输送到 GPU 中，同时防止 I/O 瓶颈。

对于需要更多永久性存储空间的应用，您也可以将 Hyperdisk 和永久性磁盘卷挂接到 G2 实例。存储容量上限取决于实例具有的 vCPU 数量。如需了解详情，请参阅支持的磁盘类型。
紧凑布置政策支持：可让您更好地控制实例在数据中心内的物理布置。这样可以在单个可用区中为实例布置提供低延迟和更高的带宽。如需了解详情，请参阅使用紧凑布置政策缩短延迟时间。

G2 机器类型

G2 加速器优化机器类型挂接了 NVIDIA L4 GPU，非常适合注重成本效益的推理、图形密集型和高性能计算工作负载。

每种 G2 机器类型还具有默认内存和自定义内存范围。自定义内存范围定义了您可以为每种机器类型分配的实例内存量。您还可以在创建 G2 实例时添加本地 SSD 磁盘。如需了解可挂接的磁盘数量，请参阅需要您选择本地 SSD 磁盘数量的机器类型。

						挂接了 NVIDIA L4 GPU
机器类型	vCPU 数量¹	默认实例内存 (GB)	自定义实例内存范围 (GB)	支持的最大本地 SSD (GiB)	网络带宽上限 (Gbps)^†	GPU 数量	GPU 内存³ (GB GDDR6)
`g2-standard-4`	4	16	16 - 32	375	10	1	24
`g2-standard-8`	8	32	32 - 54	375	16	1	24
`g2-standard-12`	12	48	48 - 54	375	16	1	24
`g2-standard-16`	16	64	54 - 64	375	32	1	24
`g2-standard-24`	24	96	96 - 108	750	32	2	48
`g2-standard-32`	32	128	96 - 128	375	32	1	24
`g2-standard-48`	48	192	192 - 216	1500	50	4	96
`g2-standard-96`	96	384	384 - 432	3000	100	8	192

G2 限制

只能使用 G2 机器类型支持的使用选项来请求容量。
使用 G2 机器类型的实例不会获得持续使用折扣和灵活承诺使用折扣。
只能在部分区域和可用区使用 G2 机器类型。
G2 机器类型仅在 Cascade Lake 平台上提供。
使用 G2 机器类型的实例不支持标准永久性磁盘 (pd-standard)。如需了解支持的磁盘类型，请参阅 G2 支持的磁盘类型。
不能在使用 G2 机器类型的实例上创建多实例 GPU。
如果您需要更改 G2 实例的机器类型，请查看修改加速器优化实例。
不能将 Deep Learning VM Image 映像用作使用 G2 机器类型的实例的启动磁盘。
Container-Optimized OS 的当前默认驱动程序不支持在 G2 机器类型上运行的 L4 GPU。此外，Container-Optimized OS 仅支持一组选定的驱动程序。如需在 G2 机器类型上使用 Container-Optimized OS，请查看以下说明：
- 使用支持推荐的最低 NVIDIA 驱动程序版本 525.60.13 或更高版本的 Container-Optimized OS 版本。如需了解详情，请查看 Container-Optimized OS 版本说明。
- 在安装驱动程序时，请指定适用于 L4 GPU 的最新可用版本。例如 sudo cos-extensions install gpu -- -version=525.60.13。
在以下情况下，必须使用 Google Cloud CLI 或 REST 创建 G2 实例：
- 您想要指定自定义内存值。
- 您想要自定义可见 CPU 核心数。

G2 实例支持的磁盘类型

G2 实例可以使用以下块存储类型：

平衡永久性磁盘 (pd-balanced)
SSD（性能）永久性磁盘 (pd-ssd)
Hyperdisk ML (hyperdisk-ml)
Hyperdisk Throughput (hyperdisk-throughput)
本地 SSD

如果机器类型支持，您可以将 Hyperdisk 卷和永久性磁盘卷混合挂接到实例，但存在以下限制：

每个实例的 Hyperdisk 卷和永久性磁盘卷的总数不能超过 128 个。
所有磁盘类型的磁盘总容量上限（以 TiB 为单位）不能超过以下值：
- 对于 vCPU 数量少于 32 个的机器类型：
  - 对于所有 Hyperdisk 或所有 Persistent Disk 为 257 TiB
  - 对于 Hyperdisk 和 Persistent Disk 的混合使用为 257 TiB
- 对于具有 32 个或更多 vCPU 的机器类型：
  - 对于所有 Hyperdisk 为 512 TiB
  - 对于 Hyperdisk 和 Persistent Disk 的混合使用为 512 TiB
  - 对于所有 Persistent Disk 为 257 TiB

如需详细了解容量限制，请参阅 Hyperdisk 大小和连接限制以及 Persistent Disk 容量上限。

加速器优化机器家族 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

按工作负载类型建议的机器系列

价格和使用选项

使用选项可用性（按机器类型）

A4X 机器系列

A4X 机器类型

A4X 限制

A4X 实例支持的磁盘类型

磁盘和容量限制

A4 机器系列

A4 机器类型

A4 限制

A4 实例支持的磁盘类型

磁盘和容量限制

A3 机器系列

A3 Ultra 机器类型

A3 Ultra 限制

A3 Mega 机器类型

A3 Mega 限制

A3 High 机器类型

A3 High 限制

A3 Edge 机器类型

A3 Edge 限制

A3 实例支持的磁盘类型

A3 Ultra

A3 Mega

A3 High

A3 Edge

磁盘和容量限制

A2 机器系列

A2 Ultra 机器类型

A2 Ultra 限制

A2 标准机器类型

A2 Standard 限制

A2 实例支持的磁盘类型

G4 机器系列

G4 机器类型

G4 限制

G4 实例支持的磁盘类型

G4 点对点 (P2P) 通信

主要优势和性能

G2 机器系列

G2 机器类型

G2 限制

G2 实例支持的磁盘类型

后续步骤

加速器优化机器家族