CPU 平台


在 Compute Engine 上创建虚拟机 (VM) 时,您需要为该虚拟机指定机器系列和机器类型。每个机器系列都与一个或多个 CPU 平台相关联。如果某个机器类型有多个可用的 CPU 平台,您可以为虚拟机选择满足最低要求的 CPU 平台。

CPU 平台提供多个物理处理器,每个处理器称为一个核心。对于 Compute Engine 上可用的所有处理器,单个 CPU 核心可以通过并发多线程 (SMT) 功能作为多个硬件多线程运行,这在 Intel 处理器上称为 Intel 超线程技术。在 Compute Engine 上,每个硬件多线程称为一个虚拟 CPU (vCPU)。当 vCPU 被报告为占用不同虚拟核心给虚拟机时,Compute Engine 会确保这些 vCPU 绝不会共享同一物理核心。

虚拟机的机器类型指定其 vCPU 数量,您可以使用该机器系列的默认 vCPU 与核心比率推断其物理 CPU 核心数量:

  • 对于 Tau T2D、Tau T2A 和 H3 机器系列,虚拟机的每个核心始终有一个 vCPU。
  • 对于所有其他机器系列,默认情况下虚拟机的每个核心有两个 vCPU。

您可以选择将虚拟机设置为每个核心有一个 vCPU,而不是每个核心有两个 vCPU,这可能对某些工作负载有利。请注意,如果您这样做,虚拟机的机器类型不再反映正确的 vCPU 数量。但价格和物理 CPU 核心数会保持不变,因为这是默认的每个核心两个 vCPU 比率的价格和物理 CPU 核心数,而 vCPU 数量则是机器类型指示的值的一半。

Arm 处理器

对于 Arm 处理器,Compute Engine 每个核心有一个线程。每个 vCPU 都映射到一个不使用 SMT 的物理核心。

下表介绍了可用于 Compute Engine 虚拟机的 Arm 处理器。

CPU 处理器 处理器 SKU 支持的机器系列和类型 全核持续频率 (GHz)
Ampere Altra Q64-30 3.0

x86 处理器

对于大多数 x86 处理器,每个 vCPU 实现为单个硬件线程。例外情况是 Tau T2D 机器系列,它的一个 vCPU 代表一个物理核心。

Intel 处理器

在 Intel Xeon 处理器上,Intel 超线程技术支持在每个核心上并发运行多个线程。虚拟机实例的特定大小和类型决定了其 vCPU 的数量。

CPU 处理器 处理器 SKU 支持的机器系列和类型 基频 (GHz) 全核 Turbo 频率 (GHz) 单核最大 Turbo 频率 (GHz)
Intel Xeon 可扩缩处理器
(Sapphire Rapids)
第 4 代
Intel® Xeon® Platinum 8481C 处理器 1.9 3.0 3.3
Intel Xeon 可扩缩处理器 (Ice Lake)
第 3 代
Intel® Xeon® Platinum
8373C 处理器
2.6 3.4 3.5
Intel Xeon 可扩缩处理器 (Cascade Lake)
第 2 代
Intel® Xeon® Gold 6268CL 处理器 2.8 3.4 3.9
Intel® Xeon® Gold 6253CL 处理器 3.1 3.8 3.9
Intel® Xeon® Platinum 8280L 处理器 2.5 3.4 4.0
Intel® Xeon® Platinum 8273CL 处理器 2.2 2.9 3.7
Intel Xeon 可扩缩处理器 (Skylake)
第 1 代
Intel® Xeon® Scalable Platinum 8173M 处理器 2.0 2.7 3.5
Intel Xeon E7 (Broadwell E7) Intel® Xeon® E7-8880V4 处理器 2.2 2.6 3.3
Intel Xeon E5 v4 (Broadwell E5) Intel® Xeon® E5-2696V4 处理器 2.2 2.8 3.7
Intel Xeon E5 v3 (Haswell) Intel® Xeon® E5-2696V3 处理器 2.3 2.8 3.8
Intel Xeon E5 v2 (Ivy Bridge) Intel® Xeon® E5-2696V2 处理器 2.5 3.1 3.5
Intel Xeon E5 (Sandy Bridge) Intel® Xeon® E5-2689 处理器 2.6 3.2 3.6

*配备 96 个或更多 vCPU 的 N2 机器类型需要使用 Intel Ice Lake CPU。

AMD 处理器

AMD 处理器使用 SMT 提供优化的性能和可伸缩性。在几乎所有情况下,Compute Engine 每个核心有两个线程,每个 vCPU 是一个线程。Tau T2D 是例外情况:Compute Engine 每个核心有一个线程,并且每个 vCPU 映射到一个物理核心。虚拟机实例的特定大小和类型决定了其 vCPU 的数量。

CPU 处理器 处理器 SKU 支持的机器系列 基频 (GHz) 有效频率 (GHz) 最大提升频率 (GHz)
AMD EPYC Genoa
第 4 代
AMD EPYC™ 9B14 2.6 3.3 3.7
AMD EPYC Milan
第 3 代
AMD EPYC™ 7B13 2.45 2.8 3.5
AMD EPYC Rome
第 2 代
AMD EPYC™ 7B12 2.25 2.7 3.3

频率行为

上表介绍了 Compute Engine 上可用的 CPU 的硬件规格,但请注意以下几点:

  • 频率:PC 的频率或时钟速度测量 CPU 每秒执行的周期数,以 GHz(千兆赫)为单位。一般而言,频率越高,性能越好。但是,由于不同的 CPU 设计处理指令的方式不同,时钟速度较快的旧 CPU 的性能有可能不如时钟速度较慢的新 CPU,这是因为较新的架构处理指令的效率更高。

    如需详细了解 CPU 时钟周期和性能,请参阅时钟频率和系统性能

  • 基频:CPU 在系统空闲或负载较低时的运行频率。以基频运行时,CPU 消耗的电量较少,产生的热量也较少。

    无论虚拟机实际运行的频率如何,虚拟机的客机环境都会反映基频。

  • 全核 Turbo 频率:每个 CPU 运行的典型频率(如果插槽中的所有内核并非同时处于空闲状态)。不同的工作负载会对系统的 CPU 产生不同的需求。加速技术可以解决这种差异,并通过提升 CPU 频率来帮助进程适应工作负载需求。

    • 即使只有基本频率通告给访客环境,大多数虚拟机也会获得全核 Turbo 频率。
    • Ampere Altra Arm 处理器可提供更可预测的性能,因为 Arm 处理器的频率始终是全核 Turbo 频率。
  • 最大 Turbo 频率:运行高负载应用(例如视频游戏或设计建模应用)时 CPU 可达到的频率。这是 CPU 在不超频的情况下可达到的最大单核频率。

  • 处理器电源管理技术:Intel 处理器支持多种技术来优化功耗。这些技术分为两类,或两种状态:

    • C-state 是 CPU 减少或关闭某些功能时的状态。
    • P-state 提供了一种调整处理器运行的频率和电压,以降低 CPU 功耗的方法。

    某些 C2(30、60 个 vCPU)、C2D(56、112 个 vCPU)和 M2(208、416 个 vCPU)机器类型通过 MWAIT 指令支持实例提供的 C-state 提示。

    Google Cloud 虚拟机不提供任何设施供客户控制 P-state。

CPU 功能

芯片制造商为其生产的 CPU 添加了计算、图形、虚拟化和内存管理等先进技术。Google Cloud 支持在 Compute Engine 中使用其中一些高级功能。

高级矩阵扩展 (AMX)

Intel AMX 是一种全新的指令集架构 (ISA) 扩展程序,旨在加速人工智能 (AI) 和机器学习 (ML) 工作负载的运行。AMX 引入了可用于执行矩阵乘法和卷积运算的新指令,这是 AI 和机器学习中最常见的两种运算。

Intel Xeon 第 4 代处理器(代号为 Sapphire Rapids)支持 AMX,该处理器为 A3 加速器优化和 C3 通用虚拟机系列提供支持。所有 C3 虚拟机机器类型都支持 AMX 指令集。

AMX 引入了二维寄存器(称为图块),加速器可以对这些寄存器执行操作。AMX 旨在作为可扩展架构。实现的第一个加速器称为图块矩阵乘法单元 (TMUL)。Sapphire Rapids 处理器的每个 CPU 核心都有一个独立的 AMX TMUL 单元。

有关 Intel AMX 的更多技术详情,请参阅 5.16 中的 Intel AMX 支持。 Intel 在代码示例:Intel® 高级矩阵扩展 (Intel® AMX) - 固有函数上提供了 AMX 教程。

使用 AMX 的要求

Intel AMX 指令有某些最低软件要求,例如:

  • 对于自定义映像,Linux 内核版本 5.16 或更高版本支持 AMX。
  • Google Cloud 在以下公共映像中支持 AMX:
    • CentOS Stream 8 或更高版本
    • Container-Optimized OS 109 LTS 或更高版本
    • RHEL 8(最新构建)或更高版本
    • Rocky Linux 8(最新构建)或更高版本
    • Ubuntu 22.04 或更高版本
    • Windows Server 2022 或更高版本
  • Tensorflow 2.9.1 或更高版本
  • 用于 PyTorch 的 Intel® 优化的 Intel 扩展程序

如需了解 C3 虚拟机的区域可用性,请参阅可用区域和可用区,并过滤表格以仅显示 C3 机器类型。

机密计算

为了保护使用中的数据,您可以在机密虚拟机实例中使用 AMD EPYC 第 3 代 CPU(代号为 Milan)。该 CPU 支持以下证明和内存加密技术:

如需了解详情,请参阅机密计算概念

后续步骤

自行试用

如果您是 Google Cloud 新手,请创建一个账号来评估 Compute Engine 在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。

免费试用 Compute Engine