使用 Compute Engine 创建虚拟机 (VM) 或裸机实例时,您需要为该实例指定机器系列和机器类型。每个机器系列都与一个或多个 CPU 平台相关联。 如果某个机器系列有多个可用的 CPU 平台,您可以为计算实例选择满足最低要求的 CPU 平台。
CPU 平台提供多个物理处理器,每个处理器称为一个核心。对于 Compute Engine 上可用的处理器,单个 CPU 核心可以通过并发多线程 (SMT) 功能作为多个硬件线程运行,这在 Intel 处理器上称为 Intel 超线程技术。在 Compute Engine 上,每个硬件线程称为一个虚拟 CPU (vCPU)。某些机器系列(例如 H3 和 T2D)不使用 SMT,每个 vCPU 代表一个核心。当 vCPU 占用不同虚拟核心报告给虚拟机时,Compute Engine 会确保这些 vCPU 绝不会共享同一物理核心。
计算实例的机器类型指定其 vCPU 数量,您可以使用该机器系列的默认 vCPU 与核心比率推断其物理 CPU 核心数量:
- 对于 Tau T2D、Tau T2A 和 H3 机器系列,虚拟机的每个核心始终有一个 vCPU。
- 对于所有其他机器系列,计算实例的每个核心有两个 vCPU 。
您可以选择将每个核心的线程数设置为非默认值,这可能对某些工作负载有利。请注意,如果您这样做,计算实例的机器类型不再反映正确的 vCPU 数量。但价格和物理 CPU 核心数会保持不变,因为这是默认的每个核心两个 vCPU 比率的价格和物理 CPU 核心数,而 vCPU 数量则是机器类型指示的值的一半。
Arm 处理器
对于 Arm 处理器,Compute Engine 每个核心有一个线程。每个 vCPU 都映射到一个不使用 SMT 的物理核心。
下表介绍了可用于 Compute Engine 实例的 Arm 处理器。
CPU 处理器 | 处理器 SKU | 支持的机器系列和类型 | 全核持续频率 (GHz) |
---|---|---|---|
Ampere Altra | Q64-30 | 3.0 |
x86 处理器
对于大多数 x86 处理器,每个 vCPU 实现为单个硬件线程。例外情况是 Tau T2D 机器系列,它的一个 vCPU 代表一个物理核心。
Intel 处理器
在 Intel Xeon 处理器上,Intel 超线程技术支持在每个核心上并发运行多个线程。计算实例的机器类型决定了其 vCPU 和内存的数量。
CPU 处理器 | 处理器 SKU | 支持的机器系列和类型 | 基频 (GHz) | 全核 Turbo 频率 (GHz) | 单核最大 Turbo 频率 (GHz) |
---|---|---|---|---|---|
Intel Xeon 可扩缩处理器 (Emerald Rapids) 第 5 代 |
|||||
Intel® Xeon® Platinum 8581C 处理器 |
2.3 | 3.1 | 4.0 | ||
Intel® Xeon® Platinum 8581C 处理器 |
2.1 | 2.9 | 3.3 | ||
Intel Xeon 可扩缩处理器 (Sapphire Rapids) 第 4 代 |
Intel® Xeon® Platinum 8490H 处理器 | 1.9 | 2.9 | 3.5 | |
Intel® Xeon® Platinum 8481C 处理器 | 2.2 | 3.0 | 3.0 | ||
Intel® Xeon® Platinum 8481C 处理器 | 2.0 | 3.8 | 2.9 | ||
Intel Xeon 可扩缩处理器 (Ice Lake) 第 3 代 |
Intel® Xeon® Platinum 8373C 处理器 |
2.6 | 3.4 | 3.5 | |
Intel Xeon 可扩缩处理器 (Cascade Lake) 第 2 代 |
|||||
Intel® Xeon® Gold 6268CL 处理器 | 2.8 | 3.4 | 3.9 | ||
Intel® Xeon® Gold 6253CL 处理器 | 3.1 | 3.8 | 3.9 | ||
Intel® Xeon® Platinum 8280L 处理器 | 2.5 | 3.4 | 4.0 | ||
Intel® Xeon® Platinum 8273CL 处理器 | 2.2 | 2.9 | 3.7 | ||
Intel Xeon 可扩缩处理器 (Skylake) 第 1 代 |
Intel® Xeon® Scalable Platinum 8173M 处理器 | 2.0 | 2.7 | 3.5 | |
Intel Xeon E7 (Broadwell E7) | Intel® Xeon® E7-8880V4 处理器 | 2.2 | 2.6 | 3.3 | |
Intel Xeon E5 v4 (Broadwell E5) | Intel® Xeon® E5-2696V4 处理器 | 2.2 | 2.8 | 3.7 | |
Intel Xeon E5 v3 (Haswell) | Intel® Xeon® E5-2696V3 处理器 | 2.3 | 2.8 | 3.8 | |
Intel Xeon E5 v2 (Ivy Bridge) | Intel® Xeon® E5-2696V2 处理器 | 2.5 | 3.1 | 3.5 | |
Intel Xeon E5 (Sandy Bridge) | Intel® Xeon® E5-2689 处理器 | 2.6 | 3.2 | 3.6 |
*配备 96 个或更多 vCPU 的 N2 机器类型需要使用 Intel Ice Lake CPU。
AMD 处理器
AMD 处理器使用 SMT 提供优化的性能和可伸缩性。 在几乎所有情况下,Compute Engine 每个核心使用两个线程,每个 vCPU 是一个线程。Tau T2D 是例外情况:Compute Engine 每个核心使用一个线程,并且每个 vCPU 映射到一个物理核心。计算实例的机器类型决定了其 vCPU 和内存的数量。
CPU 处理器 | 处理器 SKU | 支持的机器系列 | 基频 (GHz) | 有效频率 (GHz) | 最大提升频率 (GHz) |
---|---|---|---|---|---|
AMD EPYC Genoa 第 4 代 |
AMD EPYC™ 9B14 | 2.6 | 3.3 | 3.7 | |
AMD EPYC Milan 第 3 代 |
AMD EPYC™ 7B13 | 2.45 | 2.8 | 3.5 | |
AMD EPYC Rome 第 2 代 |
AMD EPYC™ 7B12 | 2.25 | 2.7 | 3.3 |
频率行为
上表介绍了 Compute Engine 上可用的 CPU 的硬件规格,但请注意以下几点:
频率:计算机的频率或时钟速度,用于衡量 CPU 每秒执行的周期数,以 GHz(千兆赫)为单位。 一般而言,频率越高,性能越好。但是,由于不同的 CPU 设计处理指令的方式不同,时钟速度较快的旧 CPU 的性能有可能不如时钟速度较慢的新 CPU,这是因为较新的架构处理指令的效率更高。
基频:CPU 在系统空闲或负载较低时的运行频率。以基频运行时,CPU 消耗的电量较少,产生的热量也较少。
无论 CPU 实际运行的频率如何,计算实例的客户机环境都会反映基频。
全核 Turbo 频率:每个 CPU 运行的典型频率(如果插槽中的所有内核并非同时处于空闲状态)。不同的工作负载会对系统的 CPU 产生不同的需求。加速技术可以解决这种差异,并通过提升 CPU 频率来帮助进程适应工作负载需求。
- 即使只有基本频率通告给客机环境,大多数计算实例也会获得全核 Turbo 频率。
- Ampere Altra Arm 处理器可提供更可预测的性能,因为 Arm 处理器的频率始终是全核 Turbo 频率。
- 将 AdvancedMachineFeature 字段设置为
ALL_CORE_MAX
后,C4 虚拟机便可以全核最大 Turbo 频率运行。如果未设置此字段,虚拟机将以默认设置(即不受限制的频率)运行。
最大 Turbo 频率:运行高负载应用(例如视频游戏或设计建模应用)时 CPU 可达到的频率。这是 CPU 在不超频的情况下可达到的最大单核频率。
处理器电源管理技术:Intel 处理器支持多种技术来优化功耗。这些技术分为两类,或两种状态:
- C-state 是 CPU 减少或关闭某些功能时的状态。
- P-state 提供了一种调整处理器运行的频率和电压,以降低 CPU 功耗的方法。
所有 C4 机器类型以及某些 C2(30、60 个 vCPU)、C2D(56、112 个 vCPU)和 M2(208、416 个 vCPU)机器类型通过
MWAIT
指令支持实例提供的 C-state 提示。Compute Engine 实例不提供任何设施供客户控制 P-state。
CPU 功能
芯片制造商为其生产的 CPU 添加了计算、图形、虚拟化和内存管理等先进技术。Google Cloud 支持在 Compute Engine 中使用其中一些高级功能。
高级矩阵扩展 (AMX)
Intel AMX 是一种全新的指令集架构 (ISA) 扩展程序,旨在加速人工智能 (AI) 和机器学习 (ML) 工作负载的运行。AMX 引入了可用于执行矩阵乘法和卷积运算的新指令,这是 AI 和机器学习中最常见的两种运算。
Intel Xeon 第 5 代处理器(代号为 Emerald Rapids)和 Intel Xeon 第 4 代处理器(代号为 Sapphire Rapids)都支持 AMX,前者为 C4 通用虚拟机系列提供支持,后者为 A3 加速器优化虚拟机和 C3 通用虚拟机提供支持。所有 C4 和 C3 虚拟机机器类型都支持 AMX 指令集。
AMX 引入了二维寄存器(称为图块),加速器可以对这些寄存器执行操作。AMX 旨在作为可扩展架构。实现的第一个加速器称为图块矩阵乘法单元 (TMUL)。Sapphire Rapids 处理器的每个 CPU 核心都有一个独立的 AMX TMUL 单元。
有关 Intel AMX 的更多技术详情,请参阅 5.16 中的 Intel AMX 支持。 Intel 在代码示例:Intel® 高级矩阵扩展 (Intel® AMX) - 固有函数上提供了 AMX 教程。
使用 AMX 的要求
Intel AMX 指令有某些最低软件要求,例如:
- 对于自定义映像,Linux 内核版本 5.16 或更高版本支持 AMX。
- Compute Engine 在以下公共映像中支持 AMX:
- CentOS Stream 8 或更高版本
- Container-Optimized OS 109 LTS 或更高版本
- RHEL 8(最新构建)或更高版本
- Rocky Linux 8(最新构建)或更高版本
- Ubuntu 22.04 或更高版本
- Windows Server 2022 或更高版本
- Tensorflow 2.9.1 或更高版本
- 用于 PyTorch 的 Intel® 优化的 Intel 扩展程序
如需了解 C4 和 C3 虚拟机的区域级可用性,请参阅可用区域和可用区,并过滤表以仅显示 C4 或 C3 机器类型。
裸金属实例可用的 CPU 功能
除了提供服务器的所有原始计算资源之外,运行在第四代Intel Xeon 可扩缩处理器上的裸机实例还可以使用多个板载、功能特定的加速器和卸载功能:
- Intel-QAT:Intel QuickAssist 技术 (Intel QAT) 可加速压缩、加密和解密
- Intel-DLB:Intel Dynamic Load Balancer (Intel DLB) 有助于加快数据队列的速度
- Intel IAA:Intel In-Memory Analytics Accelerator (Intel IAA) 可提高查询处理性能。
- Intel DSA:Intel Data Streaming Accelerator (Intel DSA) 有助于更快地复制和移动数据。
机密计算
为了保护使用中的数据,您可以使用支持机密计算技术的 CPU 平台来创建机密虚拟机实例。
如需详细了解创建机密虚拟机实例的要求,请参阅受支持的配置。
后续步骤
- 详细了解机器系列。
- 详细了解虚拟机实例。
- 详细了解映像。
- 了解如何指定满足最低要求的 CPU 平台。
自行试用
如果您是 Google Cloud 新手,请创建一个账号来评估 Compute Engine 在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
免费试用 Compute Engine