在 Compute 上執行 Arm VM


Google Cloud 透過 C4A 和 A4X 機器系列,在 Compute Engine 中提供一系列 Arm 伺服器。ARM 架構經過最佳化處理,運作效率相當卓越,因此成本效益更高。

與 x86 伺服器相比,Arm 處理器能源效率較高,因此常見於標準伺服器。手機和筆電就是採用 Arm 處理器的裝置。Arm CPU 的指令集較少,因此指令越少,效能速度就越快,電池和電力消耗也越低。

舉例來說,C4A 使用 Google 的自訂 Arm 處理器 Axion,該處理器是以 Arm Neoverse V2 處理器為基礎。Neoverse V2 是首款 V 系列 CPU,具備 Armv9 效能、電源和安全防護強化功能。專為高效能運算、機器學習和一般用途的雲端運算而設計。建議您將 C4A 一般用途 Arm 虛擬機器 (VM) 用於下列用途:

  • 執行需要視需求快速調度資源的運算密集型工作負載。
  • 針對與 Arm 相容的工作負載,以最符合成本效益的方式提升效能。
  • 以現代開放原始碼軟體堆疊為基礎建構。
  • 開發及測試使用 Arm CPU 的行動或嵌入式系統。
  • 評估工作負載是否適合 Arm CPU。

如要搭配使用 GPU 和 Arm 架構 CPU,請選擇 A4X 機器系列,該系列採用 NVIDIA GB200 NVL72 平台。使用這個機器系列建立的 VM 會附加 NVIDIA GB200 Grace Blackwell Superchip。這個機器系列經過最佳化處理,適用於大規模平行的 Compute Unified Device Architecture (CUDA) 運算工作負載,例如機器學習 (ML) 和高效能運算 (HPC)。

A4X 系列機器

A4X 是第一個同時搭載 Arm 架構 CPU 和附加 GPU 的 Compute Engine VM。A4X 提供最多 140 個 vCPU 和 884 GB 記憶體的機器類型。A4X 使用 NVIDIA GB200 GPU,每個 GPU 提供 180 GB 的記憶體。A4X 具有兩個插槽,搭載 NVIDIA Grace Arm CPU,並透過快速晶片對晶片 (NVLink C2C) 通訊連線至四個 B200 GPU。A4X 適用於 a4x-highgpu-4g 機器類型。

A4X 執行個體的儲存空間選項

A4X 可搭配 Google Cloud Hyperdisk 附加儲存空間使用,並隨附 12,000 GiB 的本機 SSD。Compute Engine 會在建立執行個體時,自動將本機 SSD 磁碟連接至 A4X 執行個體。

作業系統映像檔

A4X 執行個體支援以 Arm 為基礎的公開 OS 映像檔。您也可以使用公開的 Arm 架構 OS 映像檔建立自訂映像檔

C4A 系列機型

C4A 是首款以 Arm 為基礎的 VM,採用 Google 的 Axion Arm64 架構 CPU。C4A 提供最多 72 個 vCPU 和 576 GB DDR5-5600 記憶體的機器類型。C4A 提供 standardhighmemhighcpu 機型。

C4A 建構於 Titanium,使用網路卸載,並透過 gVNIC 網路介面,為每部 VM 提供高達 100 Gbps 的 Tier_1 網路效能。C4A 也支援 NVMe 磁碟介面,搭配 Hyperdisk Balanced 和 Hyperdisk Extreme 磁碟使用。

多執行緒並行

如果是 C4A 系列機器,每個 vCPU 都由單一核心支援,且沒有多執行緒並行 (SMT)。因此,與啟用 SMT 的 VM 相比,C4A VM 的每 vCPU 效能更高。雖然 SMT 可為特定工作負載帶來好處,但單一執行緒核心非常適合耗用大量運算資源的工作負載,因為程序可以存取整個核心,不必與其他程序共用。

作業系統映像檔

C4A VM 支援公開的 Arm 架構 OS 映像檔。您也可以使用公開的 Arm 架構映像檔建立自訂映像檔

Tau T2A 系列機型

Tau T2A Arm 機器系列搭載 64 核心 Ampere Altra Arm 處理器,全核心頻率為 3.0 GHz。Tau T2A 可讓您在 Arm 上執行最適合或專屬的工作負載。

Tau T2A 系列機器提供預先定義的機器類型,最多可搭載 48 個實體核心,每個 vCPU 具備 4 GB 記憶體。Tau T2A 機型會在單一 NUMA 節點中執行。

Tau T2A 機型僅支援 NVMe 儲存介面,以及Google 虛擬 NIC (gVNIC) 網路介面。系統不支援 Virtio-Net 和 SCSI 介面。所有公開發布的 Arm OS 映像檔都已設定為使用 NVMe 和 gVNIC 介面。gVNIC 是專為 Compute Engine 設計的網路介面。這種方式效能更好,且支援更高的網路頻寬和處理量。

在這個系列中,每個 vCPU 都由單一核心支援,且沒有多執行緒並行 (SMT)。

工作負載建議

C4A 機器系列非常適合各種擴充和運算密集型工作負載,尤其是在成本效益是主要考量時。部署下列工作負載時,請考慮使用 C4A:

  • 機器學習資料處理
  • 機器學習推論和模型服務
  • 應用程式放送、網站放送和遊戲放送
  • 嵌入式系統開發
  • 在 Arm 上的 CI/CD 進行開發
  • 影片和圖片編碼、轉碼及處理
  • 數位廣告交易平台和放送
  • 快取伺服器
  • 運算藥物研發
  • Android 應用程式開發
  • 自主或傳統汽車軟體開發

後續步驟