電源管理單元總覽

本文說明 Compute Engine 中效能監控單元 (PMU) 的行為、計費方式和限制。如要瞭解如何在 C4A 或 C4 虛擬機器 (VM) 執行個體中啟用 PMU,請參閱「在 VM 中啟用 PMU」。

PMU 是 CPU 核心內的硬體元件,可監控處理器執行程式碼的方式。在 C4A 或 C4 VM 中啟用 PMU 後,您可以使用效能監控軟體存取 PMU 中的效能計數器。這種做法可協助您找出並解決應用程式的效能瓶頸,進而最佳化效能敏感型工作負載,例如高效能運算 (HPC) 或機器學習 (ML) 工作負載。

PMU 的運作方式

PMU 由一組稱為效能監控計數器 (PMC) 的硬體計數器組成。這些計數器是特定於模型的暫存器,可計算 CPU 內每次發生低階處理器事件 (例如分支預測錯誤或快取未命中) 的次數。您可以使用 Intel VTune Profiler 等效能監控軟體,在 PMU 中讀取及設定 PMC。

根據預設,VM 內會停用 PMU。如要啟用這項功能,請啟用下列其中一種 PMU 類型,指定要追蹤的低階 CPU 事件類型:

  • 架構 (ARCHITECTURAL):您可以評估下列架構效能事件:

    • 已淘汰的分支指令:已淘汰的分支指令數。您可以使用這項事件評估程式碼的執行情況,並找出潛在的效能瓶頸。

    • Branch misses retired:預測錯誤的分支指令數量,導致處理器停止運作並捨棄擷取的指令。如果這個事件的數量偏高,您可能可以提升 CPU 效能。

    • 已完成的指令:CPU 成功處理的指令數量。使用這個事件評估 CPU 的指令輸送量。

    • 由上而下的時段:處理器管道中可用於同時執行指令的時段數量。您可以透過這項事件,瞭解程式碼使用處理器資源的效率。

    • 未暫停的核心週期:執行緒未暫停時的核心週期數,例如因電源管理或中斷而未暫停。您可以使用這項事件評估處理器的整體使用情況。

    • 未停止的參考週期:核心未停止時的參考週期數,例如擷取資料或指令時。核心執行 HLTMWAIT 指令時會停止運作。參考週期以固定頻率運作,即使處理器速度改變以節省能源,仍可提供穩定的時間參考。您可以使用這個事件測量工作所花費的時間,並找出程式碼中的效能瓶頸。

  • 標準 (STANDARD):您可以測量架構 PMU 類型中的所有事件,以及 CPU 核心內的任何本機事件,包括第 2 級 (L2) 快取事件。

  • 增強 (ENHANCED):您可以評估標準 PMU 類型中的所有事件,以及 CPU 核心以外的任何本機事件,包括第 3 級 (L3) 快取事件。

在 VM 中啟用 PMU 後,PMU 會在背景執行,並使用 PMC 持續監控效能事件。您也可以使用偏好的效能監控軟體,為特定 PMC 設定門檻。如果 PMC 超過指定門檻,PMU 就會通知軟體。

限制

PMU 有下列限制:

  • 您只能在下列 CPU 平台中啟用 PMU:

    CPU 平台 支援的機器系列 支援的成效事件
    Google Axion™ 處理器 C4A Arm Neoverse V2 PMU 指南
    Intel Xeon 可擴充處理器 (Emerald Rapids) 第 5 代 C4 emeraldrapids_core.json
  • 只有使用 C4 機型且有 96 或 192 個 vCPU 的 VM,才能啟用強化型 PMU 類型。

定價

在 VM 中啟用或停用 PMU 不會產生任何費用。

後續步驟