Per impostazione predefinita, Ops Agent e l'agente Monitoring precedente sono configurati per raccogliere le metriche che acquisiscono informazioni sui processi in esecuzione sulle tue macchine virtuali (VM) Compute Engine. Puoi anche raccogliere queste metriche su VM Amazon Elastic Compute Cloud (EC2) utilizzando l'agente Monitoring.
Questo insieme di metriche, chiamato metriche di processo, è identificabile dal prefisso agent.googleapis.com/processes
. Queste metriche
non vengono raccolte su Google Kubernetes Engine (GKE).
A partire dal 6 agosto 2 2021, verranno introdotti gli addebiti per queste metriche, come descritto in Metriche addebitabili. L'insieme di metriche di processo è classificato come addebitabile, ma gli addebiti non sono mai stati implementati.
Questo documento descrive gli strumenti per visualizzare le metriche di processo, come determinare la quantità di dati che importi da queste metriche e come ridurre al minimo gli addebiti correlati.
Utilizzare le metriche di processo
Puoi visualizzare i dati delle metriche relative ai processi con i grafici creati utilizzando Metrics Explorer o dashboard personalizzate. Per ulteriori informazioni, consulta Utilizzare dashboard e grafici. Inoltre, Cloud Monitoring include i dati delle metriche di processo in due dashboard predefinite:
- Dashboard Istanze VM in Monitoraggio
- Dashboard Dettagli dell'istanza VM in Compute Engine
Le sezioni seguenti descrivono queste dashboard.
Monitoraggio: visualizza le metriche dei processi aggregate
Per visualizzare le metriche dei processi aggregate in un ambito delle metriche, vai alla scheda Processi della dashboard Istanze VM:
-
Nella console Google Cloud, vai alla pagina Dashboard:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
Seleziona la dashboard Istanze VM dall'elenco.
Fai clic su Processi.
Lo screenshot seguente mostra un esempio della pagina Monitoraggio Processi:
Puoi utilizzare i grafici nella scheda Processi per identificare i processi nell'ambito delle metriche che consumano più CPU e memoria e che hanno il maggiore utilizzo del disco.
Compute Engine: visualizza le metriche sul rendimento delle VM che consumano più risorse
Per visualizzare i grafici delle prestazioni che mostrano le cinque VM che consumano più di una risorsa nel tuo progetto Google Cloud, vai alla scheda Osservabilità per le tue istanze VM:
-
Nella console Google Cloud, vai alla pagina Istanze VM:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Compute Engine.
- Fai clic su Osservabilità.
Lo screenshot seguente mostra un esempio della pagina Osservabilità di Compute Engine.
Per informazioni sull'utilizzo di queste metriche per diagnosticare i problemi relativi alle VM, consulta la sezione Risoluzione dei problemi di prestazioni delle VM.
Compute Engine: visualizza le metriche dei processi per VM
Per visualizzare un elenco dei processi in esecuzione su una singola macchina virtuale (VM) Compute Engine e i grafici dei processi con il maggiore consumo di risorse, vai alla scheda Osservabilità della VM:
-
Nella console Google Cloud, vai alla pagina Istanze VM:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Compute Engine.
Nella scheda Istanze, fai clic sul nome di una VM da ispezionare.
Fai clic su Osservabilità per visualizzare le metriche relative a questa VM.
Nel riquadro di navigazione della scheda Osservabilità, seleziona Processi.
Lo screenshot seguente mostra un esempio della pagina Processi di Compute Engine:
Le metriche dei processi vengono conservate per un massimo di 24 ore, quindi puoi utilizzarle per esaminare i dati passati e attribuire le anomalie nel consumo di risorse a processi specifici o identificare i consumatori di risorse più costosi. Ad esempio, il seguente grafico mostra i processi che consumano le maggiori percentuali di risorse della CPU. Puoi utilizzare il selettore dell'intervallo di tempo per modificare l'intervallo di tempo del grafico. Il selettore dell'intervallo di tempo offre valori preimpostati, come l'ora più recente, e ti consente anche di inserire un intervallo di tempo personalizzato.
La tabella Processi in esecuzione fornisce un elenco del consumo di risorse simile all'output del comando top
di Linux.
Per impostazione predefinita, la tabella mostra uno snapshot dei dati più recenti.
Tuttavia, se selezioni un intervallo di tempo in un grafico che termina nel passato,
la tabella mostra i processi in esecuzione alla fine dell'intervallo.
Per informazioni sull'utilizzo di queste metriche per diagnosticare i problemi relativi alle VM, consulta la sezione Risoluzione dei problemi di prestazioni delle VM.
Metriche di processo raccolte dall'agente
Gli agenti Linux raccolgono tutte le metriche elencate nella tabella seguente dai processi in esecuzione sulle VM Compute Engine e, utilizzando l'agente di monitoraggio, dalle VM Amazon Elastic Compute Cloud (EC2). Puoi disattivarne la raccolta tramite Ops Agent (versioni 2.0.0 e successive) e l'agente Monitoring legacy.
Puoi anche disattivare la raccolta delle metriche di processo per Ops Agent (versioni 2.0.0 e successive) in esecuzione su VM Windows.
Per ulteriori informazioni, consulta Disattivare le metriche dei processi.
Se vuoi disattivare la raccolta di queste metriche su Windows, ti consigliamo di eseguire l'upgrade alla versione 2.0.0 o successiva di Ops Agent. Per ulteriori informazioni, vedi Installazione di Ops Agent.
Tabella delle metriche di processo
Le stringhe "tipo metrica" in questa tabella devono essere precedute dal prefisso
agent.googleapis.com/processes/
. Questo prefisso è stato
omesso dalle voci della tabella.
Quando esegui una query su un'etichetta, utilizza il prefisso metric.labels.
, ad esempio metric.labels.LABEL="VALUE"
.
Tipo di metrica Fase di lancio (livelli della gerarchia delle risorse) Nome visualizzato |
|
---|---|
Tipo, Tipo, Unità Risorse monitorate |
Descrizione Etichette |
count_by_state
GA
(project)
Processi |
|
GAUGE , DOUBLE , 1
aws_ec2_instance baremetalsolution.googleapis.com/Instance gce_instance |
Conteggio dei processi nello stato specificato. Solo per Linux. Campionamento eseguito ogni 60 secondi.
state :
Corsa, sonno, zombie e così via.
|
cpu_time
GA
(project)
CPU del processo |
|
CUMULATIVE , INT64 , us{CPU}
aws_ec2_instance baremetalsolution.googleapis.com/Instance gce_instance |
Tempo di CPU del processo specificato. Campionamento eseguito ogni 60 secondi.
process :
Nome del processo.
user_or_syst :
Indica se si tratta di un processo utente o di sistema.
command :
Elabora il comando.
command_line :
Esegui la riga di comando, massimo 1024 caratteri.
owner :
Proprietario del processo.
pid :
ID processo.
|
disk/read_bytes_count
GA
(project)
Elabora I/O di lettura del disco |
|
CUMULATIVE , INT64 , By
aws_ec2_instance baremetalsolution.googleapis.com/Instance gce_instance |
Elabora l'I/O di lettura del disco. Solo per Linux. Campionamento eseguito ogni 60 secondi.
process :
Nome del processo.
command :
Elabora il comando.
command_line :
Esegui la riga di comando, massimo 1024 caratteri.
owner :
Proprietario del processo.
pid :
ID processo.
|
disk/write_bytes_count
GA
(project)
Elabora I/O scrittura disco |
|
CUMULATIVE , INT64 , By
aws_ec2_instance baremetalsolution.googleapis.com/Instance gce_instance |
Elabora l'I/O di scrittura disco. Solo per Linux. Campionamento eseguito ogni 60 secondi.
process :
Nome del processo.
command :
Elabora il comando.
command_line :
Esegui la riga di comando, massimo 1024 caratteri.
owner :
Proprietario del processo.
pid :
ID processo.
|
fork_count
GA
(project)
Numero di forchette |
|
CUMULATIVE , INT64 , 1
aws_ec2_instance baremetalsolution.googleapis.com/Instance gce_instance |
Numero totale di processi fork. Solo per Linux. Campionamento eseguito ogni 60 secondi. |
rss_usage
GA
(project)
Memoria residente del processo |
|
GAUGE , DOUBLE , By
aws_ec2_instance baremetalsolution.googleapis.com/Instance gce_instance |
Utilizzo della memoria residente del processo specificato. Solo per Linux. Campionamento eseguito ogni 60 secondi.
process :
Nome del processo.
command :
Elabora il comando.
command_line :
Esegui la riga di comando, massimo 1024 caratteri.
owner :
Proprietario del processo.
pid :
ID processo.
|
vm_usage
GA
(project)
Memoria virtuale del processo |
|
GAUGE , DOUBLE , By
aws_ec2_instance baremetalsolution.googleapis.com/Instance gce_instance |
Utilizzo della VM del processo specificato. Campionamento eseguito ogni 60 secondi.
process :
Nome del processo.
command :
Elabora il comando.
command_line :
Esegui la riga di comando, massimo 1024 caratteri.
owner :
Proprietario del processo.
pid :
ID processo.
|
Tabella generata il 12/09/2024 alle ore 02:25:45 UTC.
Determinazione dell'importazione corrente
Puoi utilizzare Metrics Explorer per vedere quanti dati stai attualmente importando per le metriche di processo. Segui questa procedura:
-
Nella console Google Cloud, vai alla pagina leaderboard Esplora metriche:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
Nella barra degli strumenti del riquadro Query Builder, seleziona il pulsante code MQL o code PromQL.
Verifica che sia selezionato MQL nel pulsante di attivazione/disattivazione Lingua. Il pulsante di attivazione/disattivazione della lingua si trova nella stessa barra degli strumenti che consente di formattare la query.
Per visualizzare il numero totale di punti delle metriche relative ai processi per le risorse
gce_instance
eaws_ec2_instance
:Inserisci la seguente query:
def tagged_process_metric name = metric 'agent.googleapis.com/processes/'$name | add [metric_suffix: $name]; def process_metrics resource_type = fetch $resource_type | { @tagged_process_metric 'cpu_time' ; @tagged_process_metric 'disk/read_bytes_count' ; @tagged_process_metric 'disk/write_bytes_count' ; @tagged_process_metric 'rss_usage' ; @tagged_process_metric 'vm_usage' ; @tagged_process_metric 'count_by_state' ; @tagged_process_metric 'fork_count' } | within 1d | group_by [metric_suffix], 1m, [row_count: row_count()] | union; { @process_metrics 'gce_instance' ; @process_metrics 'aws_ec2_instance' } | outer_join 0, 0 | { rename [], [out: val(0)] | add [resource_type: 'gce_instance'] ; rename [], [out: val(1)] | add [resource_type: 'aws_ec2_instance'] } | union | group_by drop[metric_suffix], 1d, .sum
Fai clic su Esegui query. Il grafico risultante mostra i valori per ciascun tipo di risorsa.
Stima del costo delle metriche
Gli esempi di prezzi di monitoraggio mostrano come stimare il costo dell'importazione delle metriche. Questi esempi possono essere applicati alle metriche di processo.
Tutte le metriche dei processi vengono campionate ogni 60 secondi e tutte scrivono punti dati conteggiati come otto byte ai fini della determinazione del prezzo.
I prezzi per le metriche di processo vengono impostati sul 5% del costo del volume standard utilizzato negli esempi di prezzi. Pertanto, se si presume che tutte le metriche negli scenari descritti in questi esempi siano metriche di processo, puoi utilizzare il 5% del costo totale per ogni scenario come stima del costo delle metriche di processo.
Disattivare la raccolta delle metriche dei processi
Esistono diversi modi per disattivare la raccolta di queste metriche da parte di Ops Agent (versioni 2.0.0 e successive) e da parte dell'agente Monitoring legacy su Linux.
Gli agenti vengono eseguiti solo sulle VM Compute Engine e, per l'agente Monitoring, sulle VM Amazon Elastic Compute Cloud (EC2); queste procedure si applicano solo a queste piattaforme.
Non puoi disattivare la raccolta da parte di Ops Agent se utilizzi versioni meno recenti di 2.0.0 o l'agente Monitoring legacy su Windows. Se vuoi disattivare la raccolta di queste metriche su Windows, ti consigliamo di eseguire l'upgrade alla versione 2.0.0 o successiva di Ops Agent. Per ulteriori informazioni, vedi Installazione di Ops Agent.
La procedura generale è la seguente:
Connettiti alla VM.
Crea una copia di backup del file di configurazione esistente. Memorizza la copia di backup al di fuori della directory di configurazione dell'agente, in modo che l'agente non tenti di caricare entrambi i file. Ad esempio, il seguente comando crea una copia del file di configurazione per l'agente di monitoraggio su Linux:
cp /etc/stackdriver/collectd.conf BACKUP_DIR/collectd.conf.bak
Modifica la configurazione utilizzando una delle opzioni descritte di seguito:
Riavvia l'agente per acquisire la nuova configurazione:
- Agente di monitoraggio:
sudo service stackdriver-agent restart
- Agente operativo:
sudo service google-cloud-ops-agent restart
- Agente di monitoraggio:
Verifica che le metriche di processo non vengano più raccolte per questa VM:
Seleziona Esplora metriche.
Fai clic su MQL.
Per una risorsa
gce_instance
, inserisci la seguente query, sostituendoVM_NAME con il nome di questa VM:fetch gce_instance | metric 'agent.googleapis.com/processes/cpu_time' | filter (metadata.system_labels.name == 'VM_NAME') | align rate(1m) | every 1m
Per una risorsa
aws_ec2_instance
, sostituiscigce_instance
nella query.Fai clic su Esegui query.
Ops Agent su Linux o Windows
La posizione del file di configurazione per l&#Ops Agent dipende dal sistema operativo:
- Per Linux:
/etc/google-cloud-ops-agent/config.yaml
- Per Windows:
C:\Program Files\Google\Cloud Operations\Ops Agent\config\config.yaml
Per disattivare la raccolta di tutte le metriche dei processi da parte di Ops Agent,
aggiungi quanto segue al file config.yaml
:
metrics: processors: metrics_filter: type: exclude_metrics metrics_pattern: - agent.googleapis.com/processes/*
Ciò esclude la raccolta delle metriche dei processi nel metrics_filter
processore che si applica alla pipeline predefinita nel servizio metrics
.
Per ulteriori informazioni sulle opzioni di configurazione di Ops Agent, consulta Configurare Ops Agent.
Agente di monitoraggio su Linux
Per disattivare la raccolta delle metriche del processo con l'agente di monitoraggio legacy, hai a disposizione le seguenti opzioni:
Le sezioni seguenti descrivono ciascuna opzione e elencano i vantaggi e i rischi associati.
Modificare il file di configurazione dell'agente
Con questa opzione, modifichi direttamente il file di configurazione principale dell'agente, /etc/stackdriver/collectd.conf
, per rimuovere le sezioni che attivano la raccolta delle metriche di processo.
Procedura
Devi apportare tre gruppi di eliminazioni al
collectd.conf
file:
Elimina la seguente configurazione del plug-in e della direttiva
LoadPlugin
:LoadPlugin processes <Plugin "processes"> ProcessMatch "all" ".*" Detail "ps_cputime" Detail "ps_disk_octets" Detail "ps_rss" Detail "ps_vm" </Plugin>
Elimina la seguente direttiva
PostCacheChain
e la configurazione della catenaPostCache
:PostCacheChain "PostCache" <Chain "PostCache"> <Rule "processes"> <Match "regex"> Plugin "^processes$" Type "^(ps_cputime|disk_octets|ps_rss|ps_vm)$" </Match> <Target "jump"> Chain "MaybeThrottleProcesses" </Target> Target "stop" </Rule> <Rule "otherwise"> <Match "throttle_metadata_keys"> OKToThrottle false HighWaterMark 5700000000 # 950M * 6 LowWaterMark 4800000000 # 800M * 6 </Match> <Target "write"> Plugin "write_gcm" </Target> </Rule> </Chain>
Elimina la catena
MaybeThrottleProcesses
utilizzata dalla catenaPostCache
:<Chain "MaybeThrottleProcesses"> <Rule "default"> <Match "throttle_metadata_keys"> OKToThrottle true TrackedMetadata "processes:pid" TrackedMetadata "processes:command" TrackedMetadata "processes:command_line" TrackedMetadata "processes:owner" </Match> <Target "write"> Plugin "write_gcm" </Target> </Rule> </Chain>
Vantaggi e rischi
- Vantaggi
- Riduci le risorse consumate dall'agente, perché le metriche non vengono mai raccolte.
- Se hai apportato altre modifiche al file
collectd.conf
, potresti riuscire a conservarle facilmente.
- Rischi
- Per modificare questo file di configurazione, devi utilizzare l'account
root
. - Rischi di introdurre errori ortografici nel file.
- Per modificare questo file di configurazione, devi utilizzare l'account
Sostituire il file di configurazione dell'agente
Con questa opzione, sostituisci il file di configurazione principale dell'agente con una versione pre-modificata in cui le sezioni pertinenti sono state rimosse per te.
Procedura
Scarica il file pre-modificato
collectd-no-process-metrics.conf
dal repository GitHub nella directory/tmp
, quindi procedi nel seguente modo:cd /tmp && curl -sSO https://raw.githubusercontent.com/Stackdriver/agent-packaging/master/collectd-no-process-metrics.conf
Sostituisci il file
collectd.conf
esistente con il file pre-modificato:cp /tmp/collectd-no-process-metrics.conf /etc/stackdriver/collectd.conf
Vantaggi e rischi
- Vantaggi
- Riduci le risorse consumate dall'agente perché le metriche non vengono mai raccolte.
- Non devi modificare manualmente il file come
root
. - Gli strumenti di gestione della configurazione possono sostituire facilmente un file.
- Rischi
- Se hai apportato altre modifiche al file
collectd.conf
, devi unire queste modifiche al file sostitutivo.
- Se hai apportato altre modifiche al file
Risoluzione dei problemi
Le procedure descritte in questo documento riguardano modifiche alla configurazione dell'agente, pertanto i problemi più probabili sono i seguenti:
- Privilegio insufficiente per modificare i file di configurazione. I file di configurazione devono essere modificati dall'account
root
. - Introduzione di errori ortografici nel file di configurazione, se lo modifichi direttamente.
Per informazioni sulla risoluzione di altri problemi, consulta la sezione Risoluzione dei problemi relativi all'agente di monitoraggio.
Agente di monitoraggio su Windows
Non puoi disattivare la raccolta delle metriche di processo dall'agente Monitoring precedente in esecuzione su VM Windows. Questo agente non è configurabile. Se vuoi disattivare la raccolta di queste metriche su Windows, ti consigliamo di eseguire l'upgrade alla versione 2.0.0 o successiva di Ops Agent. Per ulteriori informazioni, vedi Installazione di Ops Agent.
Se utilizzi Ops Agent, consulta Ops Agent su Linux o Windows.