HPC 优化实例非常适合计算密集型和高性能计算 (HPC) 工作负载。HPC 优化实例可提供最高的每核心性能,基于利用非统一内存访问 (NUMA) 等功能的架构构建,以实现最佳可靠的统一性能。
机器 | 工作负载 |
---|---|
H4D 机器系列(预览版) |
|
H3 机器系列 |
|
此机器系列提供了以下机器家族:
- H4D 实例(预览版)由 AMD EPYC Turin 处理器提供支持,该处理器的基频为 2.7 GHz,最高频率为 4.1 GHz。H4D 实例具有 192 个核心 (vCPU),内存最高可达 1,488 GB。H4D 实例可与本地 SSD 存储空间和 Cloud RDMA 网络搭配使用。
- H3 实例由两个第 4 代 Intel Xeon 可扩展处理器(代号为 Sapphire Rapids)驱动,全核频率可达 3.0 GHz。H3 实例具有 88 个 vCPU 和 352 GB 的 DDR5 内存。
H4D 机器系列
H4D 实例由 AMD EPYC Turin 第 5 代处理器和 Titanium 分流处理器驱动。
H4D 实例可为多节点工作负载提供高性能、低成本和可伸缩性。H4D 实例是单线程的,针对跨多个节点扩缩的紧密耦合应用进行了优化。这些实例利用了支持 RDMA 的 200 Gbps 网络和 Cluster Director 等技术,可优先考虑性能和特定于工作负载的优化。此外,您还可以使用动态工作负载调度器来安排或立即部署集群,这使得 H4D 非常适合高性能计算突发性工作负载需求。
H4D 实例使用整个宿主服务器上的所有 vCPU。H4D 实例可以使用整个主机网络带宽,并具有最高 200 Gbps 的默认网络带宽速度。不过,从实例到互联网的带宽上限为 1 Gbps。
H4D 实例的并发多线程 (SMT) 已停用,并且无法启用。也没有过度使用功能来确保实现最佳性能一致性。
H4D 实例按需提供,也支持一年和三年期承诺使用折扣 (CUD)。如需比较这些方法,请参阅 Compute Engine 实例预配模型。
H4D 限制
H4D 机器系列具有以下限制:
- H4D 机器类型仅在预定义机器类型中提供。 自定义机器类型不可用。
- 您不能将 GPU 与 H4D 实例搭配使用。
- 出站数据传输限制为 1 Gbps。
- 您无法通过 H4D 实例创建机器映像。
- H4D 机器映像无法用于创建磁盘。
- 您无法在实例之间共享磁盘,无论是处于多写入者模式还是只读模式。
- Hyperdisk Balanced 性能上限为 15,000 IOPS 和 240 MBps 的吞吐量。
- H4D 实例不支持实时迁移。
H4D 机器类型
机器类型 | vCPU 数量1 | 内存 (GB) | Titanium SSD | 默认出站流量带宽 (Gbps)2 | NUMA 节点 |
---|---|---|---|---|---|
h4d-highmem-192-lssd |
192 | 1,488 | (10 x 375 GiB) 3,750 GiB |
最高 200 Gbps | 2 |
1 一个 vCPU 代表整个核心,没有并发多线程 (SMT)。
2 默认出站流量带宽不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。请参阅网络带宽。
H4D 支持的磁盘类型
H4D 实例可以使用以下块存储类型:
- Hyperdisk Balanced (
hyperdisk-balanced
) - 本地 Titanium SSD
磁盘和容量限制
需要遵循以下限制:
- 每个虚拟机的 Hyperdisk 卷数不得超过 64 个。
- 所有磁盘的磁盘总容量上限不得超过 512 TiB。
如需详细了解容量限制,请参阅每个虚拟机的 Hyperdisk 容量限制。
下表介绍了 H4D 存储限制:
每个实例的磁盘数量上限 | ||||
---|---|---|---|---|
机器类型 | 所有 Hyperdisk 类型 |
平衡 Hyperdisk | Hyperdisk Throughput | Hyperdisk Extreme |
h4d-highmem-192-lssd |
64 | 8 | 0 | 0 |
H4D 实例的网络支持
H4D 实例需要使用 gVNIC 网络接口。H4D 支持最高 200 Gbps 的标准网络带宽。实例到互联网的出站带宽上限为 1 Gbps。
支持 RDMA 的实例需要至少两个网络接口 (vNIC)。一个 vNIC 用于正常联网,完全连接到 Google 网络,并且可以选择性地连接到互联网。此 vNIC 使用 gVNIC 驱动程序。另一个 vNIC 使用 Intel iDPF/iRDMA 驱动程序,用于 RDMA 通信。RDMA vNIC 不会连接到互联网。
在迁移到 H4D 或创建 H4D 实例之前,请确保您使用的操作系统映像完全受 H4D 支持。完全支持的映像包括对 200 Gbps 网络带宽的支持。 如果您使用的是 Cloud RDMA,则操作系统映像还必须支持 IRDMA 网络接口类型。如果 H4D 实例使用的操作系统不受完全支持或具有旧版网络驱动程序,则实例可能无法达到 H4D 实例的最大网络带宽。
H4D 实例的维护体验
在 Compute Engine 实例的生命周期内,运行实例的宿主机会经历多个宿主机事件。 主机事件可能包括 Compute Engine 基础设施的定期维护,或在极少数情况下出现主机错误。Compute Engine 还会在后台为 Hypervisor 和网络应用一些轻量级升级,而不会发生中断。
H4D 机器系列提供以下与主机维护相关的功能:
机器类型 | 典型的预定维护事件频率 | 维护行为 | 高级通知 | 按需维护 | 模拟维护 |
---|---|---|---|---|---|
h4d-highmem-192-lssd |
最短 30 天 | 终止并具有本地 SSD 数据持久性 | 7 天 | 是 | 是 |
上表中列出的维护频率为近似值,并不保证准确。Compute Engine 有时可能更频繁地执行维护。
H3 机器系列
H3 实例由第 4 代 Intel Xeon 可扩展处理器(代号为 Sapphire Rapids)、DDR5 内存和 Titanium 分流处理器驱动。
H3 实例为 Compute Engine 中的计算密集型高性能计算 (HPC) 工作负载提供出色的性价比。H3 实例是单线程的,非常适合各种建模和模拟工作负载,包括计算流体动力学、碰撞安全、基因组学、金融建模以及一般科学和工程计算。H3 实例支持紧凑布置,该布置针对跨多个节点扩缩的紧密耦合应用进行了优化。
H3 系列只有一个大小,由整个主机服务器组成。如需节省许可费用,您可以自定义可见核心数,但实例的价格相同。H3 实例可以使用整个主机网络带宽,并具有最高 200 Gbps 的默认网络带宽速度。不过,从实例到互联网的带宽上限为 1 Gbps。
H3 实例的并发多线程 (SMT) 已停用,并且无法启用。也没有过度使用功能来确保实现最佳性能一致性。
H3 实例按需提供,也支持一年和三年期承诺使用折扣 (CUD)。H3 实例可与 Google Kubernetes Engine 搭配使用。
H3 限制
H3 机器系列具有以下限制:
- H3 机器系列仅在预定义机器类型中提供。在自定义机器类型中不可用。
- 您不能将 GPU 与 H3 实例搭配使用。
- 出站数据传输限制为 1 Gbps。
- Persistent Disk 和 Google Cloud Hyperdisk 性能上限为 15,000 IOPS 和 240 MBps 的吞吐量。
- H3 实例不支持机器映像。
- H3 实例仅支持 NVMe 存储接口。
- H3 实例映像无法用于创建磁盘。
- H3 实例不支持在实例之间共享磁盘,无论是处于多写入者模式还是只读模式。
H3 机器类型
H3 实例以预定义配置提供,具有 88 个 vCPU 和 352 GB 内存。
机器类型 | vCPU 数量1 | 内存 (GB) | 本地 SSD | 默认出站流量 带宽 (Gbps)2 |
---|---|---|---|---|
h3-standard-88 |
88 | 352 | 不支持 | 最高 200 Gbps |
1 一个 vCPU 代表整个核心,没有并发多线程 (SMT)。
2 默认出站流量带宽不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。请参阅网络带宽。
H3 支持的磁盘类型
H3 实例可以使用以下块存储类型:
- 平衡永久性磁盘 (
pd-balanced
) - Hyperdisk Balanced (
hyperdisk-balanced
) - Hyperdisk Throughput (
hyperdisk-throughput
)
磁盘和容量限制
如果机器类型支持,您可以同时将 Hyperdisk 卷和永久性磁盘卷挂接到实例,但存在以下限制:
- 每个实例的 Hyperdisk 卷和永久性磁盘卷的总数不能超过 128 个。
所有磁盘类型的磁盘总容量上限(以 TiB 为单位)不能超过以下值:
- 对于所有 Hyperdisk 为 512 TiB
- 对于 Hyperdisk 和 Persistent Disk 的混合使用为 512 TiB
- 对于所有 Persistent Disk 为 257 TiB
如需详细了解容量限制,请参阅 Hyperdisk 大小和连接限制以及 Persistent Disk 容量上限。
下表介绍了 H3 存储限制:
每个实例的磁盘数量上限 | |||||
---|---|---|---|---|---|
机器类型 | 所有磁盘类型 1 | 所有 Hyperdisk 类型 |
平衡 Hyperdisk | Hyperdisk Throughput | Hyperdisk Extreme |
h3-standard-88 |
128 | 64 | 8 | 64 | 0 |
1 此限制适用于永久性磁盘和 Hyperdisk,但不包括本地 SSD 磁盘。
H3 实例的网络支持
H3 实例需要使用 gVNIC 网络接口。H3 支持最高 200 Gbps 的标准网络带宽。
在迁移到 H3 或创建 H3 实例之前,请确保您使用的操作系统映像支持 gVNIC 驱动程序。如需在 H3 实例上获得最佳性能,请在操作系统详细信息表的网络功能标签页中,选择同时支持“Tier_1 网络”和“200 Gbps 网络带宽”的操作系统映像。即使客户机操作系统显示 gve
驱动程序版本为 1.0.0,这些映像也包含更新后的 gVNIC 驱动程序。如果 H3 实例使用的操作系统具有旧版 gVNIC 驱动程序,则仍受支持,但实例的性能可能不太理想,例如网络带宽较低或延迟时间较长。
如果您将自定义操作系统映像与 H3 机器系列搭配使用,则可以手动安装最新的 gVNIC 驱动程序。建议将 gVNIC 驱动程序 v1.4.2 版或更高版本用于 H3 实例。Google 建议使用最新的 gVNIC 驱动程序版本,以从更多功能和 bug 修复中获益。
H3 实例的维护体验
在 Compute Engine 实例的生命周期内,运行实例的宿主机会经历多个宿主机事件。 主机事件可能包括 Compute Engine 基础设施的定期维护,或在极少数情况下出现主机错误。Compute Engine 还会在后台为 Hypervisor 和网络应用一些轻量级升级,而不会发生中断。
H3 机器系列提供以下与主机维护相关的功能:
机器类型 | 典型的预定维护事件频率 | 维护行为 | 高级通知 | 按需维护 | 模拟维护 |
---|---|---|---|---|---|
h3-standard-88 |
最短 30 天 | 实时迁移 | 7 天 | 是 | 是 |
上表中列出的维护频率为近似值,并不保证准确。Compute Engine 有时可能更频繁地执行维护。
后续步骤
- 创建实例。
- #待办事项:创建用于批量创建 H4D 实例的链接
- 查看 Compute Engine 实例价格。
- 配置具有高带宽网络的实例