Questo documento descrive il comportamento, la fatturazione e le limitazioni dei dell'unità di monitoraggio delle prestazioni (PMU) in Compute Engine. La PMU è disponibile solo sulle istanze di macchine virtuali (VM) C4.
Il PMU è un componente hardware all'interno del core della CPU che monitora il modo un processore esegue il codice. Se attivi la PMU in una VM C4, puoi utilizzare il software di monitoraggio delle prestazioni sulla VM per accedere ai contatori delle prestazioni della PMU. Questi contatori consentono di identificare e risolvere problemi di prestazioni all'interno di al software in esecuzione sulla VM. Queste informazioni sono utili per ottimizzare carichi di lavoro sensibili alle prestazioni, come il computing ad alte prestazioni (HPC) o carichi di lavoro di machine learning (ML).
Come funziona il PMU
La PMU è composta da un insieme di contatori hardware chiamati contatori di monitoraggio delle prestazioni (PMC). Questi contatori vengono registri specifici per modello che conteggiano ogni volta che si verifica un evento del processore di basso livello, ad esempio un errore di previsione in un ramo o un fallimento della cache, si verifica all'interno della CPU. Puoi leggere e configurare i PMC nella PMU utilizzando un software di monitoraggio delle prestazioni come Intel VTune Profiler.
Per impostazione predefinita, la PMU è disabilitata nelle VM. Per attivarla, specifica i tipi di eventi CPU a basso livello da monitorare attivando uno dei seguenti tipi di PMU:
Architettural (
ARCHITECTURAL
): puoi misurare i seguenti eventi di rendimento dell'architettura:Istruzioni di ramo ritirate: il numero di istruzioni di ramo ritirate. Utilizza questo evento per misurare l'esecuzione del codice e identificare potenziali colli di bottiglia del rendimento.
Mancati errori nella filiale: il numero di istruzioni per le filiali che sono state che causa lo stallo del processore e lo scarto recuperato istruzioni. Se vedi un numero elevato per questo evento, probabilmente puoi ottimizzare le prestazioni della CPU.
Istruzioni ritirate: il numero di istruzioni utilizzate dalla CPU vengono elaborati correttamente. Utilizza questo evento per misurare l'istruzione della CPU e la velocità effettiva effettiva.
Slot dall'alto verso il basso: il numero di slot disponibili all'interno della pipeline di un processore utilizzati per eseguire contemporaneamente le istruzioni. Utilizza questo evento per capire con quanta efficienza il tuo codice utilizza le risorse del processore.
Cicli core non interrotti: il numero di cicli core quando il thread viene non viene interrotto, ad esempio a causa di interruzioni o gestione dell'alimentazione. Utilizza le funzionalità di questo evento per valutare l'utilizzo complessivo del processore.
Cicli di riferimento non interrotti: il numero di cicli di riferimento quando il nucleo non è fermo, ad esempio durante il recupero di dati o istruzioni. Il core viene interrotto quando esegue le istruzioni
HLT
oMWAIT
. I cicli di riferimento operano a frequenza fissa e forniscono riferimento anche quando la velocità del processore cambia per risparmiare energia. Utilizza questo evento per misurare il tempo impiegato per un'attività e identificare i colli di bottiglia delle prestazioni nel codice.
Standard (
STANDARD
): puoi misurare tutti gli eventi della classe Tipo di PMU ed eventuali eventi locali all'interno del core della CPU, incluso il livello 2 (L2) Cache.Avanzata (
ENHANCED
): puoi misurare tutti gli eventi del PMU standard qualsiasi evento locale esterno al core della CPU, inclusa la cache di livello 3 (L3) eventi.
Dopo aver abilitato la PMU in una VM, quest'ultima viene eseguita in background gli eventi di rendimento tramite i PMC. Facoltativamente, puoi configurare le soglie per PMC specifiche utilizzando il software di monitoraggio delle prestazioni che preferisci. Se un PMC supera la soglia designata, il PMU comunica al software.
Limitazioni
Per il PMU si applicano le seguenti limitazioni:
Puoi abilitare la PMU solo nelle VM C4 che specificano la tecnologia Intel Xeon scalabile Processore (Emerald Rapids) di quinta generazione, specificato per impostazione predefinita dalle VM C4. Per un elenco completo degli eventi relativi alle prestazioni supportati per questa piattaforma CPU, consulta emeraldrapids_core.json.
È possibile abilitare il tipo PMU avanzato solo nei tipi di macchina C4 con 96 o 192 di memoria per vCPU.
Prezzi
L'abilitazione o la disabilitazione del PMU in una VM non comporta alcun costo.
Passaggi successivi
- Scopri come abilitare la PMU nelle VM.