Questo documento descrive le origini delle informazioni di diagnostica che puoi utilizzare per identificare i problemi di installazione o esecuzione di Ops Agent.
Verificare lo stato dell'agente utilizzando gcpdiag
Puoi usare gcpdiag per segnalare lo stato di Ops Agent su un singolo VM o l'intero parco risorse all'interno del progetto, a conferma che l'agente installato e invia attivamente log e metriche. gcpdiag può creare report di stato in diversi formati, tra cui CSV o JSON.
Di seguito viene mostrato un report sullo stato dell'agente a livello di parco risorse in formato CSV:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-1,failed,Ops Agent not installed on the VM,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-2,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-3,skipped,VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.,https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-4,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
gce/ERR/2024_004,projects/my-project/zones/my-location/instances/instance-5,ok,"Ops Agent installed on the VM, and is successfully sending logs and metrics.",https://gcpdiag.dev/rules/gce/ERR/2024_004
Lo strumento Google Cloud è stato creato dall'assistenza Google Cloud per aiutarti diagnosticare autonomamente i problemi comuni nel progetto Google Cloud, inclusi quelli relativi al Ops Agent. gcpdiag è uno strumento open source, non un servizio Google Cloud ufficiale ma è costantemente sviluppato e gestito dal team di assistenza di Google Cloud. Contribuisci o segnala i problemi su GitHub.
Prima di iniziare
gcpdiag è integrato con Cloud Shell, quindi puoi eseguirlo senza alcuna installazione. Per eseguire gcpdiag, devi prima soddisfare i seguenti requisiti prerequisiti:
Autorizzazione: utilizza gcpdiag credenziali predefinite dell'applicazione (ADC) in Cloud Shell.
Assicurati che le credenziali utilizzate con gcpdiag abbiano almeno i seguenti ruoli del progetto Google Cloud, in cui è in esecuzione Ops Agent:- Visualizzatore (
roles/viewer
) - Consumer utilizzo dei servizi (
roles/serviceusage.serviceUsageConsumer
)
- Visualizzatore (
API: per utilizzare gcpdiag in un progetto, devono essere attivate le seguenti API:
- API Cloud Resource Manager:
cloudresourcemanager.googleapis.com
- API Identity and Access Management:
iam.googleapis.com
- API Cloud Logging:
logging.googleapis.com
- Utilizzo del servizio:
serviceusage.googleapis.com
Per abilitare queste API, esegui il comando seguente in Cloud Shell o in un'altra riga di comando:
gcloud --project=PROJECT_ID services enable \ cloudresourcemanager.googleapis.com \ iam.googleapis.com \ logging.googleapis.com \ serviceusage.googleapis.com
- API Cloud Resource Manager:
VM Manager: abilita VM Manager a livello gratuito per la tua istanza. Se hai installato Ops Agent durante la creazione della VM o se un criterio dell'agente gestisce l' installazione di Ops Agent sulle tue istanze VM, hai già soddisfatto i requisiti per VM Manager.
Esegui gcpdiag
Il comando gcpdiag
da utilizzare con Ops Agent
ha la seguente sintassi di base:
gcpdiag lint --project=PROJECT_ID [--name=INSTANCE_NAME] --show-skipped --include=gce/err/2024_004 [--output=[CSV|JSON]]
- PROJECT_ID è l'ID del tuo progetto Google Cloud.
- INSTANCE_NAME è il nome della tua VM Compute Engine.
Utilizza l'opzione
--name
per eseguire query su una VM specifica. ometti l'opzione per eseguire query sull'intero parco risorse. - Utilizza l'opzione
--output
per salvare il report in un file in formato CSV o JSON. ometti l'opzione se non vuoi un file di output.
Il valore dell'opzione --include
specifica una o più regole gcpdiag.
gce/ERR/2024-004
è la regola per Ops Agent.
Per ulteriori informazioni sulla sintassi del comando gcpdiag, consulta gcpdiag - Diagnostica per la piattaforma Google Cloud.
Ad esempio, per generare un report per l'intero parco per il progetto "my-project", esegui il seguente comando:
gcpdiag lint --project=my-project --show-skipped --include=gce/ERR/2024_004
L'output è simile al seguente:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/instance-1 [FAIL] Ops Agent not installed on the VM
- my-project/instance-2 [FAIL] Ops Agent not installed on the VM
- my-project/instance-3 [SKIP] Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection. Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
- my-project/instance-4 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
- my-project/instance-5 [FAIL] Ops Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (No) Is Ops Agent sending metrics? (No)
- my-project/instance-6 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
- my-project/instance-7 [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Per generare un report per l'istanza "my-instance" nel progetto "my-project", esegui il seguente comando:
gcpdiag lint --project=my-project --name=my-instance --show-skipped --include=gce/err/2024_004
L'output è simile al seguente:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics.
- my-project/my-instance [ OK ] Ops Agent installed on the VM, and is successfully sending logs and metrics.
Se il comando gcpdiag
non va a buon fine e l'output è simile al seguente,
verifica di aver soddisfatto tutti i prerequisiti
per l'esecuzione dello strumento.
WARNING:googleapiclient.http:Encountered 403 Forbidden with reason "PERMISSION_DENIED"
[ERROR]:can't access project my-project: Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry..
[DEBUG]: An Http Error occurred whiles accessing projects.get
HttpError 403 when requesting https://cloudresourcemanager.googleapis.com/v3/projects/my-project?alt=json returned Cloud Resource Manager API has not been used in project my-project before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/cloudresourcemanager.googleapis.com/overview?project=my-project then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry. Details: ...
[ERROR]:exiting program...
error getting project details
Interpreta l'output di gcpdiag
Questa sezione fornisce informazioni che ti aiutano a comprendere e utilizzare i report generate da gcpdiag.
Il comando gcpdiag genera report contenenti le seguenti informazioni:
- Un indicatore della regola gcpdiag con cui è stato richiamato il comando.
Per Ops Agent, le informazioni sono le seguenti:
🔎 gce/ERR/2024_004: Verify Ops Agent is installed on GCE VMs and is sending logs and metrics
- Un identificatore del risultato per una VM specifica con il formato PROJECT_ID/INSTANCE_ID. Per un report a livello di parco risorse, l'output contiene una voce per ogni VM. Per un report su VM singola, l'output contiene una singola voce.
- Lo stato del controllo. Lo stato ha uno dei seguenti valori:
- Una descrizione del valore dello stato.
Le sezioni seguenti forniscono ulteriori informazioni sui valori di stato e sul loro significato.
Stato: OK
Uno stato OK
indica che l'agente operativo è in esecuzione sulla VM e invia sia i log sia le metriche dalla VM. Il report include la seguente descrizione dello stato:
Ops Agent installed on the VM, and is successfully sending logs and metrics.
Stato: FAIL
Lo stato FAIL
indica che Ops Agent non è installato,
o non invia log e metriche dalla VM. La descrizione dello stato
indica quale problema è stato rilevato:
- Se Ops Agent non è installato, viene visualizzata la seguente descrizione dello stato:
Ops Agent not installed on the VM
- Se Ops Agent non invia sia i log sia le metriche dalla VM,
viene visualizzata una descrizione dello stato simile alla seguente:
Agent is installed, but it's failing to send both logs and metrics to Google Cloud.
Is Ops Agent sending logs? (Yes) Is Ops Agent sending metrics? (No)
Se Ops Agent non è installato, installalo. Se l'installazione non va a buon fine, il problema potrebbe essere uno dei seguenti:
- La VM non ha un account di servizio associato. Per risolvere il problema, collega un account di servizio alla VM, quindi prova nuovamente a installare Ops Agent.
- Nella VM è già installato uno degli agenti legacy (l'agente Monitoring o l'agente Logging). Per risolvere il problema, disinstalla gli agenti legacy, e poi prova installare Ops Agent di nuovo.
Se Ops Agent non invia log o metriche dalla VM, utilizza i controlli di integrità dell'agente per gli errori relativi all'ora di inizio per determinare e correggere il problema.
Stato: SKIP
Lo stato SKIP
indica che gcpdiag non è riuscito a determinare
se Ops Agent è installato sulla VM. Il report include la seguente descrizione dello stato:
Unable to confirm Ops Agent installation
VM Manager is needed for the ops agent detection.
Please enable it at: https://cloud.google.com/compute/docs/manage-os#automatic and run this check again.
Per testare lo stato dell'agente, gcpdiag deve
Gestore VM
in esecuzione sulla tua VM. Per risolvere il problema, installa il
livello gratuito di VM Manager sull'istanza. Dopo l'installazione, attendi 15 minuti e poi riprova
eseguendo nuovamente il comando gcpdiag
.
Controlli di integrità dell'agente
La versione 2.25.1 ha introdotto i controlli di integrità all'ora di inizio per Ops Agent. All'avvio, Ops Agent esegue una serie di controlli per verificare le condizioni che impediscono l'esecuzione corretta dell'agente. Se l'agente rileva una delle condizioni, registra un messaggio che descrive il problema. Ops Agent verifica quanto segue:
- Problemi di connettività
- Disponibilità delle porte utilizzate dall'agente per generare report sulle proprie metriche
- Problemi di autorizzazione
- Disponibilità delle API utilizzate dall'agente per scrivere log o metriche
- Un problema nella routine di controllo di integrità stessa.
La versione 2.37.0 ha introdotto i controlli di integrità di runtime per l'agente operativo. Questi errori vengono segnalati a Cloud Logging ed Error Reporting. Per informazioni su come individuare gli errori di runtime, consulta Trovare gli errori di runtime.
La versione 2.46.0 ha introdotto la
Codice di LogPingOpsAgent
. Questo codice non rappresenta un errore.
Per ulteriori informazioni, vedi
Verifica che la raccolta dei log sia andata a buon fine.
La tabella seguente elenca ogni codice di controllo dell'integrità in ordine alfabetico e descrive il significato di ciascun codice. Codici che terminano con la stringa
Err
indicano errori; altri codici sono informativi.
Codice per il controllo di integrità | Categoria | Significato | Suggerimento |
---|---|---|---|
DLApiConnErr
|
Connettività |
La richiesta al sottodominio dei download, dl.google.com , non è andata a buon fine.
|
Controlla la connessione a internet e le regole del firewall. Per ulteriori informazioni, vedi Problemi di connettività di rete. |
FbMetricsPortErr
|
Disponibilità porte | La porta 20202, necessaria per le metriche personali di Ops Agent, non è disponibile. | Verifica che la porta 20202 sia aperta. Per ulteriori informazioni, vedi La porta obbligatoria non è disponibile. |
HcFailureErr
|
Generic | Si è verificato un errore interno della routine di controllo di integrità di Ops Agent. | Invia una richiesta di assistenza dalla console Google Cloud. Per ulteriori informazioni, vedi Richiesta di assistenza. |
LogApiConnErr
|
Connettività | Richiesta all'API Logging non riuscita. | Controlla la connessione a internet e le regole del firewall. Per saperne di più, consulta Problemi di connettività di rete. |
LogApiDisabledErr
|
API | L'API Logging è disabilitata nel progetto Google Cloud corrente. | Abilita l'API Logging. |
LogApiPermissionErr
|
Autorizzazione |
Nell'account di servizio manca il ruolo Writer log
(roles/logging.logWriter ).
|
Concedi il ruolo Writer di log all'account di servizio. Per ulteriori informazioni, consulta All'agente mancano le autorizzazioni API. |
LogApiScopeErr
|
Autorizzazione | Nella VM manca l'ambito di accesso https://www.googleapis.com/auth/logging.write. | Aggiungi l'ambito https://www.googleapis.com/auth/logging.write alla VM. Per ulteriori informazioni, consulta Verificare gli ambiti di accesso. |
LogApiUnauthenticatedErr
|
API | La VM attuale non ha potuto eseguire l'autenticazione nell'API Logging. | Verifica che i file delle credenziali, gli ambiti di accesso alle VM e le autorizzazioni siano impostati correttamente. Per ulteriori informazioni, vedi Autorizza Ops Agent. |
LogPingOpsAgent
|
Un messaggio informativo del payload scritto ogni 10 minuti nel
log ops-agent-health . Puoi utilizzare le voci del log risultanti per verificare che l'agente invii i log. Questo messaggio non è
un errore.
|
Questo messaggio dovrebbe essere visualizzato ogni 10 minuti. Se il messaggio non viene visualizzato per 20 minuti o più, l'agente potrebbe aver riscontrato un problema. Per informazioni sulla risoluzione dei problemi, vedi Risolvi i problemi di Ops Agent. | |
LogParseErr
|
Runtime | Ops Agent non è riuscito ad analizzare uno o più log. | Controlla la configurazione di eventuali processori di logging che hai creato. Per ulteriori informazioni, consulta la sezione Errori di analisi dei log. |
LogPipeLineErr
|
Runtime | La pipeline di logging di Ops Agent non è riuscita. | Verificare che l'agente abbia accesso ai file del buffer; verifica la presenza di un pieno e verifica che la configurazione di Ops Agent sia corretta. Per ulteriori informazioni, consulta Errori della pipeline. |
MetaApiConnErr
|
Connettività | Richiesta al server G C E Metadata per l'esecuzione di query sugli ambiti di accesso alle VM, Etichette delle risorse ed token OAuth non riusciti. | Controlla la connessione a internet e le regole del firewall. Per saperne di più, consulta Problemi di connettività di rete. |
MonApiConnErr
|
Connettività | Richiesta all'API Monitoring non riuscita. | Controlla la connessione a internet e le regole del firewall. Per ulteriori informazioni, vedi Problemi di connettività di rete. |
MonApiDisabledErr
|
API | L'API Monitoring è disabilitata nel progetto Google Cloud corrente. | Attiva l'API Monitoring. |
MonApiPermissionErr
|
Autorizzazione |
Nell'account di servizio manca il ruolo Writer metriche monitoraggio
(roles/monitoring.metricWriter ).
|
Concedi il ruolo Scrittore di metriche di monitoraggio all'account di servizio. Per ulteriori informazioni, vedi L'agente non dispone delle autorizzazioni API. |
MonApiScopeErr
|
Autorizzazione | Nella VM manca l'ambito di accesso https://www.googleapis.com/auth/monitoring.write. | Aggiungi l'ambito https://www.googleapis.com/auth/monitoring.write alla VM. Per ulteriori informazioni, vedi Verifica gli ambiti di accesso. |
MonApiUnauthenticatedErr
|
API | La VM attuale non è riuscita ad autenticarsi con l'API Monitoring. | Verifica che i file delle credenziali, gli ambiti di accesso alle VM e le autorizzazioni siano impostati correttamente. Per ulteriori informazioni, consulta Autorizza Ops Agent. |
OtelMetricsPortErr
|
Disponibilità porte | La porta 20201, necessaria per le metriche di autovalutazione di Ops Agent, non è disponibile. | Verifica che la porta 20201 sia aperta. Per ulteriori informazioni, consulta Una porta richiesta non è disponibile. |
PacApiConnErr
|
Connettività | Questo codice per il controllo di integrità non è affidabile. Questo codice è disattivato nella versione 2.46.1 di Ops Agent. | Esegui l'aggiornamento alla versione Ops Agent 2.46.1 o successiva. |
Individuare gli errori relativi all'ora di inizio
A partire dalla versione 2.35.0, le informazioni relative al controllo di stato vengono scritte nel log ops-agent-health
dall'API Cloud Logging (le versioni 2.33.0 e 2.34.0 utilizzano ops-agent-health-checks
).
Le stesse informazioni vengono scritte anche in un file health-checks.log
come segue:
- Linux:
/var/log/google-cloud-ops-agent/health-checks.log
- Windows:
C:\ProgramData\Google\Cloud Operations\Ops Agent\log\health-checks.log
Puoi anche visualizzare eventuali messaggi di controllo di integrità eseguendo una query sullo stato del servizio Ops Agent nel seguente modo:
- Su Linux, esegui il seguente comando:
sudo systemctl status google-cloud-ops-agent"*"
Cerca messaggi come "[Controllo porte] Risultato: PASS". Altri risultati includono "ERROR" e "NON SUPERATO".
- Su Windows, utilizza il Visualizzatore eventi di Windows. Cerca
"Informazioni", "Errore" o "Errore" messaggi
associati al servizio
google-cloud-ops-agent
.
Dopo aver risolto gli eventuali problemi, devi riavvia l'agente. I controlli di integrità vengono eseguiti all'avvio dell'agente, quindi per eseguirli di nuovo devi riavviare l'agente.
Individuare gli errori di runtime
I controlli di integrità del runtime vengono segnalati sia a Cloud Logging che ed Error Reporting. Se l'avvio dell'agente non è riuscito, ma è stato in grado di segnalare errori prima del fallimento, potresti anche visualizzare errori relativi all'ora di inizio.
Per visualizzare gli errori di runtime da Ops Agent in Logging, procedi nel seguente modo: seguenti:
-
Nella console Google Cloud, vai alla pagina Esplora log:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Logging.
- Inserisci la seguente query e fai clic su Esegui query:
log_id("ops-agent-health")
Per visualizzare gli errori di runtime di Ops Agent in Segnalazione errori: segui questi passaggi:
-
Nella console Google Cloud, vai alla pagina Error Reporting:
Puoi trovare questa pagina anche utilizzando la barra di ricerca.
- Per visualizzare gli errori di Ops Agent, filtra gli errori per
Ops Agent
.
Verificare la raccolta dei log
La versione 2.46.0 dell'agente operativo ha introdotto il controllo di integrità LogPingOpsAgent
informativo. Questo controllo scrive un
messaggio informativo inviato al ops-agent-health
ogni 10 minuti.
Puoi utilizzare la presenza di questi messaggi per verificare che Ops Agent stia
scrivendo i log eseguendo una delle seguenti operazioni:
- Cerca i messaggi di ping nei log di una VM specifica utilizzando Esplora log.
- Verificare il valore della metrica
log_entry_count
per una VM specifica utilizzando Esplora metriche. - Crea un criterio di avviso per inviare una notifica
se una VM specifica non aggiorna
log_entry_count
.
Se una di queste opzioni indica che i messaggi di log non vengono importati, puoi:
- Verifica la presenza di codici di errore che indicano errori di avvio o errori di runtime.
- Determina se l'agente operativo è in esecuzione.
- Esegui lo script di diagnostica dell'agente.
Per controllare lo stato dell'agente operativo su una VM specifica, devi disporre dell'ID istanza della VM. Per trovare l'ID istanza:
-
Nella console Google Cloud, vai alla pagina Istanze VM:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Compute Engine.
- Fai clic sul nome di un'istanza VM.
- Nella scheda Dettagli, individua la sezione Informazioni di base. L'ID istanza viene visualizzato come una stringa numerica. Usa questa stringa per INSTANCE_ID nelle sezioni successive.
Strumento di diagnostica degli agenti per le VM
Lo strumento di diagnostica degli agenti raccoglie informazioni critiche di debug locale dalle le VM per tutti i seguenti agenti: Ops Agent, legacy Agente Logging e agente Monitoring legacy. Le informazioni di debugging includono, ad esempio, informazioni sul progetto, sulla VM, sulla configurazione dell'agente, sui log dell'agente, sullo stato del servizio dell'agente e informazioni che in genere richiedono un intervento manuale per essere raccolte. Lo strumento controlla anche l'ambiente VM locale assicurarsi che soddisfi determinati requisiti per il corretto funzionamento degli agenti, ad esempio ad esempio la connettività di rete e le autorizzazioni richieste.
Esegui l'agente quando invii una richiesta di assistenza a un cliente su una VM strumento di diagnostica e allega alla richiesta le informazioni raccolte. Queste informazioni riducono il tempo necessario per risolvere i problemi del tuo una richiesta di assistenza. Prima di allegare le informazioni alla richiesta di assistenza, oscurare informazioni sensibili come le password.
Lo strumento di diagnostica dell'agente deve essere eseguito dall'interno della VM, pertanto in genere dovrai prima connetterti alla VM tramite SSH. Il seguente comando recupera lo strumento di diagnostica dell'agente ed esegue:
Linux
curl -sSO https://dl.google.com/cloudagents/diagnose-agents.sh
sudo bash diagnose-agents.sh
Windows
(New-Object Net.WebClient).DownloadFile("https://dl.google.com/cloudagents/diagnose-agents.ps1", "${env:UserProfile}\diagnose-agents.ps1")
Invoke-Expression "${env:UserProfile}\diagnose-agents.ps1"
Segui l'output dell'esecuzione dello script per individuare i file che includono le informazioni raccolte. In genere puoi trovarli nella directory /var/tmp/google-agents
su Linux e nella directory $env:LOCALAPPDATA/Temp
su Windows, a meno che tu non abbia personalizzato la directory di output durante l'esecuzione dello script.
Per informazioni dettagliate, esamina lo script diagnose-agents.sh
su Linux o
Script diagnose-agents.ps1
su Windows.
Strumento di diagnostica dell'agente per i criteri di installazione automatica
Se si tenta di installare Ops Agent utilizzando un criterio di sistema operativo di Ops Agent non riesce, puoi utilizzare lo script di diagnostica descritto in questa sezione per il debug del machine learning. Ad esempio, potresti visualizzare uno dei seguenti casi:
- L'installazione di Ops Agent non va a buon fine se hai utilizzato la casella di controllo Installa Ops Agent per il monitoraggio e il logging per installare Ops Agent durante la creazione della VM.
Lo stato dell'agente nella dashboard delle istanze VM di Cloud Monitoring o nella scheda Osservabilità nella pagina dei dettagli di una VM Compute Engine rimane nello stato Pending (In attesa) per più di 10 minuti. Lo stato In attesa prolungato potrebbe indicare uno dei seguenti motivi:
- Problema nell'applicazione del criterio.
- Un problema nell'installazione effettiva di Ops Agent.
- Un problema di connettività tra la VM e Cloud Monitoring.
Per alcuni di questi problemi, potrebbero essere utili anche lo script di diagnostica dell'agente e i controlli di salute.
Per eseguire lo script di diagnostica dei criteri, esegui i seguenti comandi:
curl -sSO https://dl.google.com/cloudagents/diagnose-ui-policies.sh bash diagnose-ui-policies.sh VM_NAME VM_ZONE
Questo script mostra informazioni sulle VM interessate e sui criteri di installazione automatica correlati.
Esegui l'agente quando invii una richiesta di assistenza a un cliente su una VM strumenti di diagnostica e allega alla richiesta le informazioni raccolte. Queste informazioni riducono il tempo necessario per risolvere i problemi del tuo una richiesta di assistenza. Prima di allegare le informazioni alla richiesta di assistenza, oscura tutte le informazioni sensibili come le password.
Autolog degli agenti
Se l'agente non riesce a importare i log in Cloud Logging, potrebbe essere necessario I log dell'agente in locale sulla VM per la risoluzione dei problemi. Puoi utilizza anche la rotazione dei log per gestire i self log dell'agente.
Linux
Per esaminare gli autolog scritti in Journald
, esegui questo comando:
journalctl -u google-cloud-ops-agent*
Per controllare i log di autolog che vengono scritti sul disco dal modulo di registrazione, esegui il seguente comando:
vim -M /var/log/google-cloud-ops-agent/subagents/logging-module.log
Windows
Per ispezionare gli autolog scritti in Windows Event Logs
, esegui questo comando
:
Get-WinEvent -FilterHashtable @{ Logname='Application'; ProviderName='google-cloud-ops-agent*' } | Format-Table -AutoSize -Wrap
Per controllare i log di autolog che vengono scritti sul disco dal modulo di registrazione, esegui il seguente comando:
notepad "C:\ProgramData\Google\Cloud Operations\Ops Agent\log\logging-module.log"
ispezionare i log da Windows Service Control Manager
per Ops Agent
esegui questo comando:
Get-WinEvent -FilterHashtable @{ Logname='System'; ProviderName='Service Control Manager' } | Where-Object -Property Message -Match 'Google Cloud Ops Agent' | Format-Table -AutoSize -Wrap
Visualizza l'utilizzo e la diagnostica delle metriche in Cloud Monitoring
La pagina Gestione delle metriche di Cloud Monitoring fornisce informazioni che può aiutarti a controllare l'importo speso per le metriche fatturabili senza influire sull'osservabilità. La pagina Gestione delle metriche riporta le seguenti informazioni:
- Volumi di importazione sia per la fatturazione basata su byte che su sample, per i domini delle metriche e per le singole metriche.
- Dati su etichette e cardinalità delle metriche.
- Numero di letture per ogni metrica.
- Utilizzo di metriche nei criteri di avviso e nelle dashboard personalizzate.
- Percentuale di errori di scrittura delle metriche.
Puoi anche utilizzare la gestione delle metriche per: escludere le metriche non necessarie, eliminando il costo dell'importazione.
Per visualizzare la pagina Gestione delle metriche:
-
Nella console Google Cloud, vai alla pagina
Gestione delle metriche:Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
- Seleziona la finestra temporale nella barra degli strumenti. Per impostazione predefinita, La pagina Gestione delle metriche mostra informazioni sulle metriche raccolte. nel giorno precedente.
Per ulteriori informazioni sulla pagina Gestione delle metriche, consulta Visualizzare e gestire l'utilizzo delle metriche.