Questo documento descrive le origini delle informazioni diagnostiche che puoi utilizzare per identificare i problemi di installazione o esecuzione di Ops Agent.
Verificare lo stato dell'agente utilizzando gcpdiag
Puoi utilizzare gcpdiag per segnalare lo stato dell'Ops Agent su singole VM o sull'intera flotta di VM all'interno del progetto, confermando che l'agente è installato e invia attivamente log e metriche. gcpdiag può creare report di stato in diversi formati, tra cui CSV o JSON.
Di seguito è riportato un report sullo stato degli agenti a livello di flotta in formato CSV:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-1,failed,Ops Agent not installed on the VM,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-2,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-3,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-4,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-5,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
Lo strumento gcpdiag è stato creato dal team di assistenza Google Cloud per aiutarti a eseguire l'autodiagnosi dei problemi comuni nel tuo progetto Google Cloud , inclusi i problemi relativi all'Ops Agent gcpdiag è uno strumento open source, non un prodotto Google Cloudufficiale, ma è sviluppato e gestito attivamente dal team di assistenza Google Cloud . Contribuisci o segnala problemi su GitHub.
Prima di iniziare
gcpdiag è integrato con Cloud Shell, quindi puoi eseguirlo senza alcuna installazione. Per eseguire gcpdiag, devi prima soddisfare i seguenti prerequisiti:
Autorizzazione: gcpdiag utilizza le credenziali predefinite dell'applicazione (ADC) in Cloud Shell per l'autenticazione.
Assicurati che le credenziali utilizzate con gcpdiag dispongano almeno dei seguenti ruoli nel progetto Google Cloud in cui è in esecuzione Ops Agent:- Visualizzatore (
roles/viewer
) - Consumer utilizzo dei servizi (
roles/serviceusage.serviceUsageConsumer
)
- Visualizzatore (
API: per utilizzare gcpdiag in un progetto, devono essere abilitate le seguenti API:
- API Cloud Resource Manager:
cloudresourcemanager.googleapis.com
- API Identity and Access Management:
iam.googleapis.com
- API Cloud Logging:
logging.googleapis.com
- Service Usage:
serviceusage.googleapis.com
Per abilitare queste API, esegui il comando seguente in Cloud Shell o in un'altra riga di comando:
gcloud --project=PROJECT_ID services enable \ cloudresourcemanager.googleapis.com \ iam.googleapis.com \ logging.googleapis.com \ serviceusage.googleapis.com
- API Cloud Resource Manager:
VM Manager: attiva VM Manager al livello gratuito sulla tua istanza. Se hai installato Ops Agent durante la creazione della VM o se un criterio agente gestisce l'installazione di Ops Agent sulle tue istanze VM, hai già soddisfatto i requisiti per VM Manager.
Esegui gcpdiag
Il comando gcpdiag
da utilizzare con Ops Agent
ha la seguente sintassi di base:
gcpdiag lint --project=PROJECT_ID [--name=INSTANCE_NAME] --show-skipped --include=gce/err/2024_004 [--output=[CSV|JSON]]
- PROJECT_ID è l'ID del tuo progetto Google Cloud .
- INSTANCE_NAME è il nome della tua VM di Compute Engine.
Utilizza l'opzione
--name
per eseguire query su una VM specifica; ometti l'opzione per eseguire query sull'intera flotta. - Utilizza l'opzione
--output
per salvare il report in un file in formato CSV o JSON; ometti l'opzione se non vuoi un file di output.
Il valore dell'opzione --include
specifica una o più regole gcpdiag;
gce/ERR/2024-004
è la regola per l'Ops Agent.
Per saperne di più sulla sintassi del comando gcpdiag,
consulta gcpdiag - Diagnostics for Google Cloud Platform.
Ad esempio, per generare un report a livello di flotta per il progetto "my-project", esegui questo comando:
gcpdiag lint --project=my-project --show-skipped --include=gce/ERR/2024_004
L'output è simile al seguente:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/instance-1 [FAIL] Ops Agent not installed on the VM
- my-project/instance-2 [FAIL] Ops Agent not installed on the VM
- my-project/instance-3 [SKIP] Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
- my-project/instance-4 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
- my-project/instance-5 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (No) Is Ops Agent sending metrics? (No)
- my-project/instance-6 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
- my-project/instance-7 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Per generare un report per l'istanza "my-instance" nel progetto "my-project", esegui questo comando:
gcpdiag lint --project=my-project --name=my-instance --show-skipped --include=gce/err/2024_004
L'output è simile al seguente:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/my-instance [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Se il comando gcpdiag
non va a buon fine e l'output è simile al seguente,
verifica di aver soddisfatto tutti i prerequisiti
per l'esecuzione dello strumento.
WARNING:googleapiclient.http:Encountered 403 Forbidden with reason "PERMISSION_DENIED"
[ERROR]:can't access project my-project: Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry..
[DEBUG]: An Http Error occurred whiles accessing projects.get
HttpError 403 when requesting https://cloudresourcemanager.googleapis.com/v3/projects/my-project?alt=json returned Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry. Details: ...
[ERROR]:exiting program...
error getting project details
Interpretare l'output di gcpdiag
Questa sezione fornisce informazioni utili per comprendere e utilizzare i report generati da gcpdiag.
Il comando gcpdiag genera report che contengono le seguenti informazioni:
- Un indicatore della regola gcpdiag con cui è stato richiamato il comando.
Per Ops Agent, queste informazioni hanno il seguente aspetto:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics
- Un identificatore del risultato per una VM specifica con il formato PROJECT_ID/INSTANCE_ID. Per un report a livello di flotta, l'output contiene una voce per ogni VM. Per un report su una singola VM, l'output contiene una sola voce.
- Lo stato del controllo. Lo stato ha uno dei seguenti valori:
- Una descrizione del valore di stato.
Le sezioni seguenti forniscono ulteriori informazioni sui valori di stato e sul loro significato.
Stato: OK
Lo stato OK
indica che l'Ops Agent è in esecuzione sulla VM e invia sia i log sia le metriche dalla VM. Il report include la seguente descrizione dello stato:
Ops Agent installed on the VM, and is successfully sending logs and metrics.
Stato: FAIL
Lo stato FAIL
indica che Ops Agent non è installato
o che non invia log e metriche dalla VM. La descrizione dello stato
indica il problema rilevato:
- Se Ops Agent non è installato, viene visualizzata la seguente descrizione
dello stato:
Ops Agent not installed on the VM
- Se Ops Agent non invia log e metriche dalla VM, viene visualizzata una descrizione dello stato come la seguente:
Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
Se Ops Agent non è installato, installalo. Se l'installazione non va a buon fine, il problema potrebbe essere uno dei seguenti:
- La VM non ha un account di servizio associato. Per risolvere il problema, collega un service account alla VM, quindi prova a installare di nuovo Ops Agent.
- La VM ha già installato uno degli agenti legacy (l'agente Monitoring o l'agente Logging). Per risolvere il problema, disinstalla gli agenti legacy e poi prova a installare di nuovo l'agente operativo.
Se Ops Agent non invia log o metriche dalla VM, utilizza i controlli di integrità dell'agente per gli errori di ora di inizio per determinare e correggere il problema.
Stato: SKIP
Lo stato SKIP
indica che gcpdiag non è riuscito a determinare
se Ops Agent è installato sulla VM. Il report include la seguente
descrizione dello stato:
Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection.
Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
Per testare lo stato dell'agente, gcpdiag richiede
che VM Manager
sia in esecuzione sulla VM. Per risolvere il problema, installa il
livello gratuito di VM Manager sulla tua istanza. Dopo l'installazione, attendi 15 minuti, quindi prova a eseguire di nuovo il comando gcpdiag
.
Controlli di integrità dell'agente
La versione 2.25.1 ha introdotto i controlli di integrità all'avvio per Ops Agent. Quando viene avviato, l'Ops Agent esegue una serie di controlli per verificare le condizioni che impediscono il corretto funzionamento dell'agente. Se l'agente rileva una delle condizioni, registra un messaggio che descrive il problema. Ops Agent verifica quanto segue:
- Problemi di connettività
- Disponibilità delle porte utilizzate dall'agente per segnalare le metriche relative a se stesso
- Problemi di autorizzazione
- Disponibilità delle API utilizzate dall'agente per scrivere log o metriche
- Un problema nella routine di controllo di integrità stessa.
La versione 2.37.0 ha introdotto i controlli di integrità di runtime per l'Ops Agento. Questi errori vengono segnalati a Cloud Logging ed Error Reporting. Per informazioni su come individuare gli errori di runtime, vedi Trovare gli errori di runtime.
La versione 2.46.0 ha introdotto il codice
LogPingOpsAgent
informativo. Questo codice non rappresenta un errore.
Per saperne di più, consulta la sezione
Verificare la raccolta dei log riuscita.
La tabella seguente elenca ogni codice di controllo dell'integrità in ordine alfabetico e
descrive il significato di ciascun codice. I codici che terminano con la stringa
Err
indicano errori; gli altri codici sono informativi.
Codice di controllo di integrità | Categoria | Significato | Suggerimento |
---|---|---|---|
DLApiConnErr
|
Connettività |
La richiesta al sottodominio dei download, dl.google.com , non è riuscita.
|
Controlla la connessione a internet e le regole firewall. Per saperne di più, consulta Problemi di connettività di rete. |
FbMetricsPortErr
|
Disponibilità delle porte | La porta 20202, necessaria per le autometriche dellOps Agent, non è disponibile. | Verifica che la porta 20202 sia aperta. Per ulteriori informazioni, vedi La porta richiesta non è disponibile. |
HcFailureErr
|
Generica | La routine di controllo di integrità di Ops Agent ha riscontrato un errore interno. | Invia una richiesta di assistenza dalla console Google Cloud . Per ulteriori informazioni, vedi Richiedere assistenza. |
LogApiConnErr
|
Connettività | Richiesta all'API Logging non riuscita. | Controlla la connessione a internet e le regole firewall. Per saperne di più, consulta Problemi di connettività di rete. |
LogApiDisabledErr
|
API | L'API Logging è disabilitata nel progetto Google Cloud corrente. | Abilita l'API Logging. |
LogApiPermissionErr
|
Autorizzazione |
Nel service account manca il ruolo Logs Writer
(roles/logging.logWriter ).
|
Concedi il ruolo Writer log all'account di servizio. Per maggiori informazioni, vedi L'agente non dispone delle autorizzazioni API. |
LogApiScopeErr
|
Autorizzazione | Alla VM manca l'ambito di accesso https://www.googleapis.com/auth/logging.write. | Aggiungi l'ambito https://www.googleapis.com/auth/logging.write alla VM. Per maggiori informazioni, vedi Verificare gli ambiti di accesso. |
LogApiUnauthenticatedErr
|
API | L'attuale VM non è riuscita ad autenticarsi all'API Logging. | Verifica che i file delle credenziali, gli ambiti di accesso VM e le autorizzazioni siano configurati correttamente. Per maggiori informazioni, vedi Autorizza Ops Agent. |
LogPingOpsAgent
|
Un messaggio di payload informativo scritto ogni 10 minuti nel log
ops-agent-health . Puoi utilizzare le voci di log risultanti
per verificare che l'agente stia inviando i log. Questo messaggio non è
un errore.
|
Questo messaggio dovrebbe essere visualizzato ogni 10 minuti. Se il messaggio non viene visualizzato per almeno 20 minuti, l'agente potrebbe aver riscontrato un problema. Per informazioni sulla risoluzione dei problemi, vedi Risoluzione dei problemi di Ops Agent. | |
LogParseErr
|
Runtime | Ops Agent non è riuscito ad analizzare uno o più log. | Controlla la configurazione di tutti i processori di logging che hai creato. Per saperne di più, consulta la sezione Errori di analisi dei log. |
LogPipeLineErr
|
Runtime | La pipeline di logging di Ops Agent non è riuscita. | Verifica che l'agente abbia accesso ai file buffer, controlla se il disco è pieno e verifica che la configurazione di Ops Agent sia corretta. Per saperne di più, vedi Errori della pipeline. |
MetaApiConnErr
|
Connettività | La richiesta al server di metadati GCE, per eseguire query sugli ambiti di accesso alle VM, sui token OAuth e sulle etichette delle risorse, non è riuscita. | Controlla la connessione a internet e le regole firewall. Per saperne di più, consulta Problemi di connettività di rete. |
MonApiConnErr
|
Connettività | Una richiesta all'API Monitoring non è andata a buon fine. | Controlla la connessione a internet e le regole firewall. Per saperne di più, consulta Problemi di connettività di rete. |
MonApiDisabledErr
|
API | L'API Monitoring è disabilitata nel progetto Google Cloud corrente. | Abilita l'API Monitoring. |
MonApiPermissionErr
|
Autorizzazione |
Nel service account manca il ruolo Writer metriche Monitoring
(roles/monitoring.metricWriter ).
|
Concedi il ruolo Writer metriche Monitoring al account di servizio. Per maggiori informazioni, vedi L'agente non dispone delle autorizzazioni API. |
MonApiScopeErr
|
Autorizzazione | Alla VM manca l'ambito di accesso https://www.googleapis.com/auth/monitoring.write. | Aggiungi l'ambito https://www.googleapis.com/auth/monitoring.write alla VM. Per maggiori informazioni, vedi Verificare gli ambiti di accesso. |
MonApiUnauthenticatedErr
|
API | La VM attuale non è riuscita ad autenticarsi all'API Monitoring. | Verifica che i file delle credenziali, gli ambiti di accesso VM e le autorizzazioni siano configurati correttamente. Per maggiori informazioni, vedi Autorizza Ops Agent. |
OtelMetricsPortErr
|
Disponibilità delle porte | La porta 20201, necessaria per le metriche automatiche di Ops Agent, non è disponibile. | Verifica che la porta 20201 sia aperta. Per ulteriori informazioni, vedi Una porta richiesta non è disponibile. |
PacApiConnErr
|
Connettività | Questo codice di controllo di integrità non è affidabile. Questo codice è disattivato nella versione 2.46.1 dell'Ops Agent. | Esegui l'aggiornamento alla versione 2.46.1 o successive di Ops Agent. |
Trovare gli errori relativi all'ora di inizio
A partire dalla versione 2.35.0, le informazioni sul controllo dell'integrità
vengono scritte nel log ops-agent-health
dall'API Cloud Logging
(le versioni 2.33.0 e 2.34.0 utilizzano ops-agent-health-checks
).
Le stesse informazioni vengono scritte anche in un file health-checks.log
nel seguente modo:
- Linux:
/var/log/google-cloud-ops-agent/health-checks.log
- Windows:
C:\ProgramData\Google\Cloud Operations\Ops Agent\log\health-checks.log
Puoi anche visualizzare i messaggi di controllo di integrità eseguendo una query sullo stato del servizio Ops Agent nel seguente modo:
- Su Linux, esegui questo comando:
sudo systemctl status google-cloud-ops-agent"*"
Cerca messaggi come "[Ports Check] Result: PASS". Altri risultati includono "ERROR" e "FAIL".
- Su Windows, utilizza il Visualizzatore eventi di Windows. Cerca i messaggi
"Informazioni", "Errore" o "Errore"
associati al servizio
google-cloud-ops-agent
.
Dopo aver risolto i problemi, devi riavviare l'agente. I controlli di integrità vengono eseguiti all'avvio dell'agente, quindi per eseguirli di nuovo devi riavviare l'agente.
Trovare errori di runtime
I controlli di integrità del runtime vengono segnalati sia a Cloud Logging sia a Error Reporting. Se l'agente non è stato avviato, ma è stato in grado di segnalare errori prima di non riuscire, potresti anche visualizzare errori relativi all'ora di avvio.
Per visualizzare gli errori di runtime di Ops Agent in Logging:
-
Nella Google Cloud console, vai alla pagina Esplora log:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Logging.
- Inserisci la seguente query e fai clic su Esegui query:
log_id("ops-agent-health")
Per visualizzare gli errori di runtime di Ops Agent in Error Reporting, segui questi passaggi:
-
Nella console Google Cloud , vai alla pagina Error Reporting:
Puoi trovare questa pagina anche utilizzando la barra di ricerca.
- Per visualizzare gli errori di Ops Agent, filtra gli errori per
Ops Agent
.
Verifica della raccolta dei log riuscita
La versione 2.46.0 dell'Ops Agent ha introdotto il
controllo di integrità informativo LogPingOpsAgent
. Questo controllo scrive un messaggio informativo in ops-agent-health
ogni 10 minuti.
Puoi utilizzare la presenza di questi messaggi per verificare che Ops Agent stia scrivendo i log eseguendo una delle seguenti operazioni:
- Cerca nei log di una VM specifica i messaggi ping utilizzando Esplora log.
- Controlla il valore della metrica
log_entry_count
per una VM specifica utilizzando Metrics Explorer. - Crea un criterio di avviso per ricevere una notifica
se una VM specifica non aggiorna la metrica
log_entry_count
.
Se una di queste opzioni indica che i messaggi di log non vengono inseriti, puoi procedere nel seguente modo:
- Controlla se sono presenti codici di errore che indicano errori di avvio o errori di runtime.
- Determina se l'Ops Agent è in esecuzione.
- Esegui lo script di diagnostica dell'agente.
Per controllare lo stato dell'Ops Agent su una VM specifica, devi disporre dell'ID istanza della VM. Per trovare l'ID istanza:
-
Nella Google Cloud console, vai alla pagina Istanze VM.
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Compute Engine.
- Fai clic sul nome di un'istanza VM.
- Nella scheda Dettagli, individua la sezione Informazioni di base. L'ID istanza viene visualizzato come stringa numerica. Utilizza questa stringa per il valore INSTANCE_ID nelle sezioni successive.
Strumento di diagnostica dell'agente per le VM
Lo strumento di diagnostica dell'agente raccoglie informazioni di debug locali critiche dalle tue VM per tutti gli agenti seguenti: Ops Agent, agente Logging legacy e agente Monitoring legacy. Le informazioni di debug includono elementi quali informazioni sul progetto, informazioni sulla VM, configurazione dell'agente, log dell'agente, stato del servizio dell'agente, informazioni che in genere richiedono un lavoro manuale per essere raccolte. Lo strumento controlla anche l'ambiente VM locale per assicurarsi che soddisfi determinati requisiti per il corretto funzionamento degli agenti, ad esempio la connettività di rete e le autorizzazioni richieste.
Quando apri una richiesta di assistenza per un agente su una VM, esegui lo strumento di diagnostica dell'agente e allega le informazioni raccolte alla richiesta. Fornire queste informazioni riduce il tempo necessario per risolvere la richiesta di assistenza. Prima di allegare le informazioni alla richiesta di assistenza, oscura tuttiinformazioni sensibilii, come le password.
Lo strumento di diagnostica dell'agente deve essere eseguito dall'interno della VM, quindi in genere devi prima accedere alla VM tramite SSH. Il comando seguente recupera lo strumento di diagnostica dell'agente e lo esegue:
Linux
curl -sSO https://dl.google.com/cloudagents/diagnose-agents.sh
sudo bash diagnose-agents.sh
Windows
(New-Object Net.WebClient).DownloadFile("https://dl.google.com/cloudagents/diagnose-agents.ps1", "${env:UserProfile}\diagnose-agents.ps1")
Invoke-Expression "${env:UserProfile}\diagnose-agents.ps1"
Segui l'output dell'esecuzione dello script per individuare i file che includono le
informazioni raccolte. In genere puoi trovarli nella directory /var/tmp/google-agents
su Linux e nella directory $env:LOCALAPPDATA/Temp
su Windows,
a meno che tu non abbia personalizzato la directory di output durante l'esecuzione dello script.
Per informazioni dettagliate, esamina lo script diagnose-agents.sh
su Linux o
lo script diagnose-agents.ps1
su Windows.
Strumento di diagnostica dell'agente per le norme di installazione automatica
Se un tentativo di installazione di Ops Agent utilizzando una policy del sistema operativo Ops Agent non va a buon fine, puoi utilizzare lo script di diagnostica descritto in questa sezione per il debug. Ad esempio, potresti riscontrare uno dei seguenti casi:
- L'installazione di Ops Agent non riesce quando hai utilizzato la casella di controllo Installa Ops Agent per il monitoraggio e il logging per installare Ops Agent durante la creazione della VM.
Lo stato dell'agente nella dashboard Istanze VM di Cloud Monitoring o nella scheda Osservabilità di una pagina dei dettagli della VM di Compute Engine rimane nello stato In attesa per più di 10 minuti. Uno stato In attesa prolungato potrebbe indicare uno dei seguenti problemi:
- Si è verificato un problema durante l'applicazione delle norme.
- Un problema nell'installazione effettiva di Ops Agent.
- Un problema di connettività tra la VM e Cloud Monitoring.
Per alcuni di questi problemi, potrebbero essere utili anche lo script di diagnostica dell'agente e i controlli di integrità.
Per eseguire lo script policy-diagnostics, esegui i seguenti comandi:
curl -sSO https://dl.google.com/cloudagents/diagnose-ui-policies.sh bash diagnose-ui-policies.sh VM_NAME VM_ZONE
Questo script mostra informazioni sulle VM interessate e sulle relative policy di installazione automatica.
Quando apri una richiesta di assistenza per un agente su una VM, esegui gli strumenti di diagnostica dell'agente e allega le informazioni raccolte alla richiesta. Fornire queste informazioni riduce il tempo necessario per risolvere la richiesta di assistenza. Prima di allegare le informazioni alla richiesta di assistenza, oscura tuttiinformazioni sensibilii, come le password.
Log automatici dell'agente
Se l'agente non riesce a importare i log in Cloud Logging, potresti dover ispezionare i log dell'agente localmente sulla VM per la risoluzione dei problemi. Puoi anche utilizzare la rotazione dei log per gestire i self log dell'agente.
Linux
Per controllare i log automatici scritti in Journald
, esegui questo comando:
journalctl -u google-cloud-ops-agent*
Per controllare i log automatici scritti sul disco dal modulo di logging, esegui il seguente comando:
vim -M /var/log/google-cloud-ops-agent/subagents/logging-module.log
Windows
Per controllare i log automatici scritti in Windows Event Logs
, esegui il seguente
comando:
Get-WinEvent -FilterHashtable @{ Logname='Application'; ProviderName='google-cloud-ops-agent*' } | Format-Table -AutoSize -Wrap
Per controllare i log automatici scritti sul disco dal modulo di logging, esegui il seguente comando:
notepad "C:\ProgramData\Google\Cloud Operations\Ops Agent\log\logging-module.log"
Per controllare i log di Windows Service Control Manager
per i servizi Ops Agent, esegui questo comando:
Get-WinEvent -FilterHashtable @{ Logname='System'; ProviderName='Service Control Manager' } | Where-Object -Property Message -Match 'Google Cloud Ops Agent' | Format-Table -AutoSize -Wrap
Visualizza l'utilizzo e la diagnostica delle metriche in Cloud Monitoring
La pagina Gestione delle metriche di Cloud Monitoring fornisce informazioni che possono aiutarti a controllare l'importo che spendi per le metriche fatturabili senza influire sull'osservabilità. La pagina Gestione delle metriche riporta le seguenti informazioni:
- Volumi di importazione per la fatturazione basata su byte e campioni, in tutti i domini delle metriche e per le singole metriche.
- Dati su etichette e cardinalità delle metriche.
- Numero di letture per ogni metrica.
- Utilizzo delle metriche nelle policy di avviso e nelle dashboard personalizzate.
- Tasso di errori di scrittura delle metriche.
Puoi anche utilizzare la pagina Gestione metriche per escludere le metriche non necessarie, eliminando il costo della loro importazione.
Per visualizzare la pagina Gestione metriche:
-
Nella console Google Cloud , vai alla pagina
Gestione metriche:Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
- Nella barra degli strumenti, seleziona la finestra temporale. Per impostazione predefinita, nella pagina Gestione metriche vengono visualizzate le informazioni sulle metriche raccolte nel giorno precedente.
Per saperne di più sulla pagina Gestione metriche, consulta Visualizzare e gestire l'utilizzo delle metriche.