Questo documento fornisce una panoramica dei servizi che Cloud Monitoring fornisce. Questi servizi possono aiutarti a comprendere il comportamento, lo stato di salute e delle tue applicazioni e di altri servizi Google Cloud. Cloud Monitoring raccoglie e memorizza automaticamente le informazioni sulle prestazioni per la maggior parte dei servizi Google Cloud. Tu può raccogliere Prometheus mediante Google Cloud Managed Service per Prometheus. Se installi Ops Agent su Compute Engine di macchine virtuali (VM), puoi raccogliere metriche e log e quelle di terze parti.
I servizi di avviso, test e visualizzazione forniti da Cloud Monitoring ti aiutano a rispondere a domande importanti, ad esempio:
- Qual è il carico sul mio servizio?
- Il mio sito web risponde correttamente?
- Il mio servizio funziona bene?
Cloud Monitoring offre il supporto sia per la console Google Cloud che per le API per la maggior parte delle
e i suoi servizi. Alcuni servizi supportano anche Google Cloud CLI o Terraform. Le pagine di riferimento dell'API Cloud Monitoring, come la pagina
alertPolicies.list
,
ti consentono di eseguire esperimenti con le chiamate API direttamente dalla pagina di riferimento.
Servizi di Cloud Monitoring
Cloud Monitoring offre diversi servizi che puoi utilizzare per comprendere l'integrità e le prestazioni delle tue applicazioni, da altri servizi Google Cloud che utilizzi.
Avvisi e notifiche
Ricevere notifiche quando il valore di una metrica di rendimento soddisfa i criteri definisci, crea un criterio di avviso. Il criterio di avviso include l'elenco di persone o gruppi che devono ricevere le notifiche. Monitoring supporta canali di notifica comuni, tra cui email, app mobile Cloud e servizi come PagerDuty o Slack. Ad esempio, puoi creare un criterio di avviso in modo da ricevere una notifica quando l'utilizzo della CPU di una VM supera l'80%.
Ogni notifica include informazioni pertinenti su un errore e un link a un incidente. Un intoppo è un record permanente che memorizza informazioni che puoi utilizzare per risolvere il problema. In genere, un record elenca lo stato dell'incidente, i link ai log, un grafico dei dati delle metriche registrate, le etichette e la durata.
Il servizio di avviso è integrato con molti servizi Google Cloud. Se queste integrazioni sono presenti, potresti visualizzare un riquadro che elenca gli avvisi consigliati o un pulsante su un grafico che ti consente di creare un criterio di avviso. In entrambi i casi, i criteri di avviso sono preconfigurati, devi specificare solo l'elenco di persone o gruppi a cui inviare le notifiche.
Puoi creare e gestire i criteri di avviso utilizzando la console Google Cloud, l'API Cloud Monitoring, Google Cloud CLI o Terraform.
Monitoraggio e convalida proattivi
Per testare la disponibilità, la coerenza e le prestazioni dei tuoi servizi, applicazioni, pagine web e API, monitor sintetici. Ad esempio: puoi verificare la reattività degli endpoint HTTP, HTTPS e TCP con controlli di uptime per poi ricevere una notifica quando l'endpoint non risponde. Puoi anche creare un strumento di verifica dei link inaccessibili per eseguire la scansione di una pagina web e poi ti avvisano quando vengono rilevati link inaccessibili.
Puoi creare e gestire monitoraggi sintetici utilizzando la console Google Cloud, l'API Cloud Monitoring, Google Cloud CLI o Terraform.
Visualizzazione dei dati
Per visualizzare i dati in modo da vedere le tendenze, identificare i valori anomali e visualizzare altri dettagli, puoi utilizzare i servizi di dashboard e grafica:
Il servizio dashboard crea automaticamente una dashboard gestita da Google Cloud quando aggiungi una risorsa al tuo progetto Google Cloud. Ad esempio, una dashboard viene creata quando crei un'istanza Compute Engine, un criterio di avviso o un monitoraggio sintetico. Puoi utilizzare queste dashboard per visualizzare informazioni sul rendimento e sulla configurazione, ad esempio l'utilizzo del disco o l'indirizzo IP, nonché per visualizzare gli eventi.
Per controllare quali dati visualizzare e il relativo formato di visualizzazione: creare una dashboard personalizzata. Ad esempio, puoi importare una dashboard di Grafana o installare una dashboard da un modello. Le dashboard personalizzate possono visualizzare grafici, tabelle, log e gruppi di errori, criteri di avviso e incidenti e testo. Puoi anche condividere dashboard personalizzate con persone o gruppi della tua organizzazione e configura queste dashboard display degli eventi.
Puoi creare e gestire le dashboard utilizzando la console Google Cloud o l'API.
Il servizio di grafici Metrics Explorer consente di visualizzare ed esplorare rapidamente i dati delle serie temporali. Le impostazioni del grafico consentono di confrontare i dati attuali con quelli precedenti, visualizzare gli outlier percentili e visualizzare più metriche. Puoi anche salvare i grafici in una dashboard personalizzata.
Raccolta e archiviazione dei dati
Cloud Monitoring raccoglie e archivia i seguenti tipi di dati delle metriche:
- Metriche di sistema generate dai servizi Google Cloud. Queste metriche forniscono informazioni sul funzionamento di un servizio.
- Metriche di sistema e delle applicazioni Ops Agent raccoglie informazioni sulle risorse di sistema e applicazioni in esecuzione sulle istanze di Compute Engine. Puoi configurare Ops Agent per raccogliere le metriche da plug-in di terze parti come i server web Apache o Nginx o i database MongoDB o PostgreSQL.
Le metriche definite dall'utente create utilizzando l'API Cloud Monitoring o una come OpenTelemetry.
Metriche esterne definite da alcune librerie open source o da fornitori di terze parti.
Metriche di Prometheus raccolte Google Cloud Managed Service per Prometheus, oppure utilizzando Ops Agent e Ricevitore Prometheus o ricevitore OTLP.
- Metriche basate su log che registrano informazioni numeriche su i log scritti in Cloud Logging. Le metriche definite da Google basate su log includono conteggi degli errori rilevati dal servizio e il numero totale numero di voci di log ricevute dal tuo progetto Google Cloud. Puoi anche definire metriche basate su log.
Linguaggio per le query
Quando crei un criterio di avviso o un grafico, devi fornire una query che descriva i dati che vuoi monitorare o rappresentare in un grafico:
Console Google Cloud: puoi creare la query effettuando selezioni dai menu o scrivendola. Gli editor di query sono disponibili per Prometheus Query Language (PromQL) e Monitoring Query Language (MQL). Gli editor di query forniscono controlli e suggerimenti sulla sintassi. Puoi anche scrivi un'espressione di filtro di monitoraggio.
API Cloud Monitoring: l'API supporta Prometheus Query Language (PromQL), query MQL ed espressioni di filtro di Monitoring.
Monitora sistemi di grandi dimensioni
Questa sezione descrive come gestire le risorse come raccolta e come monitorare le metriche archiviate in più progetti Google Cloud.
Gestione delle risorse come raccolta
Per gestire le risorse come una raccolta invece che singolarmente, crea un gruppo di risorse. Un gruppo di risorse è una raccolta dinamica di risorse che soddisfano alcuni criteri da te indicati. Man mano che aggiungi e rimuovi risorse, aggiungendo ad esempio istanze VM di Compute Engine progetto Google Cloud, la partecipazione al gruppo cambia automaticamente. Di seguito sono riportati alcuni esempi di gruppi di risorse:
- Istanze Compute Engine i cui nomi iniziano con la stringa
prod-
. - Risorse con il tag
test-cluster
. - Istanze Amazon EC2 nella regione A o nella regione B.
Dopo aver definito un gruppo di risorse, puoi monitorarlo come se fosse una singola risorsa. Ad esempio, puoi configurare un controllo di uptime per monitorare un gruppo di risorse. Per i grafici e i criteri di avviso, puoi anche filtrare in base al nome del gruppo.
Per ulteriori informazioni, vedi Configurare i gruppi di risorse.
Monitorare le metriche per più progetti Google Cloud
Per visualizzare e monitorare i dati delle serie temporali per più i progetti Google Cloud e gli account AWS tramite un'unica interfaccia, Configura un ambito delle metriche multiprogetto.
Per impostazione predefinita, le pagine di Cloud Monitoring nella console Google Cloud forniscono accesso solo alle serie temporali archiviate nel progetto di ambito. Il progetto di ambito è il progetto selezionato con il selettore di progetti della console Google Cloud. Il progetto di definizione dell'ambito immagazzina gli avvisi, i monitoraggi sintetici, le dashboard e i gruppi di monitoraggio che configuri.
Il progetto di definizione dell'ambito ospita anche un ambito delle metriche. L'ambito delle metriche definisce i progetti e gli account le cui metriche vengono visibile al progetto di definizione dell'ambito. Puoi configurare l'ambito delle metriche per includere i dati delle serie temporali di altri progetti Google Cloud e degli account AWS. Per informazioni su come modificare un ambito delle metriche, consulta Configura un ambito delle metriche per più progetti.
Modello dei dati di Cloud Monitoring
Questa sezione illustra il modello di dati di Cloud Monitoring:
Un tipo di metrica descrive qualcosa che misurata. Alcuni esempi di tipi di metriche sono l'utilizzo della CPU di una VM e la percentuale di un disco utilizzata.
Una serie temporale è una struttura di dati che contiene misurazioni con timestamp di una metrica e informazioni sulla fonte e sul significato di queste misurazioni.
Ecco alcuni dettagli sul contenuto di una serie temporale:
L'array
points
contiene le misurazioni con timestamp.Di seguito è riportato un esempio di array
points
con due valori:"points": [ { "interval": { "startTime": "2020-07-27T20:20:21.597143Z", "endTime": "2020-07-27T20:20:21.597143Z" }, "value": { "doubleValue": 0.473005 } }, { "interval": { "startTime": "2020-07-27T20:19:21.597239Z", "endTime": "2020-07-27T20:19:21.597239Z" }, "value": { "doubleValue": 0.473025 } }, ],
Per comprendere il significato di un valore, è necessario fare riferimento agli altri dati inclusi nelle serie temporali e alle relative definizioni.
Il campo
resource
descrive il componente hardware o software in fase di monitoraggio. In Cloud Monitoring, il componente hardware o software è indicato come risorsa monitorata. Tra gli esempi di risorse monitorate c'è Compute Engine di deployment e applicazioni App Engine. Per un elenco delle risorse monitorate, consulta l'elenco delle risorse monitorate.Di seguito è riportato un esempio di campo
resource
:"resource": { "type": "gce_instance", "labels": { "instance_id": "2708613220420473591", "zone": "us-east1-b", "project_id": "sampleproject" } }
Il campo
type
elenca la risorsa monitorata comegce_instance
, che indica che vengono effettuate su un'istanza VM di Compute Engine.Il campo
labels
contiene coppie chiave-valore che forniscono dati aggiuntivi sulla risorsa monitorata. Per un tipogce_instance
, le etichette identificano l'istanza VM monitorata.
Il campo
metric
descrive cosa viene misurato.Di seguito è riportato un esempio di campo
metric
:"metric": { "labels": { "instance_name": "test" }, "type": "compute.googleapis.com/instance/cpu/utilization" },
- Per i servizi Google Cloud, il campo
type
specifica il servizio e la è in fase di monitoraggio. In questo esempio, il servizio Compute Engine la misurazione dell'utilizzo della CPU. Quando il campotype
inizia concustom
oexternal
, la metrica è personalizzata o definita da terze parti.
- Il campo
labels
contiene coppie chiave-valore che forniscono dati aggiuntivi informazioni sulla misurazione. Queste etichette sono definite nell'ambito delMetricDescriptor
, una struttura di dati che definisce gli attributi dei dati misurati.MetricDescriptor
per la metricacompute.googleapis.com/instance/cpu/utilization
include l'etichettainstance_name
.
- Per i servizi Google Cloud, il campo
Il campo
metricKind
descrive la relazione tra le misurazioni adiacenti all'interno di una serie temporale:Le metriche
GAUGE
memorizzano il valore dell'elemento misurata in un determinato momento, ad esempio una tariffa oraria la registrazione della temperatura corporea.Le metriche
CUMULATIVE
memorizzano il valore accumulato della misura in un determinato momento, ad esempio un contachilometri in un veicolo.Le metriche
DELTA
memorizzano la variazione del valore dell'elemento misurata nel corso di un determinato periodo, ad esempio un'azione riepilogo che mostra i guadagni o le perdite dell'azione.
Il campo
valueType
descrive il tipo di dati per l'attributo misurazione:INT64
,DOUBLE
,BOOL
,STRING
oDISTRIBUTION
- Puoi mostrare l'utilizzo della CPU di ogni istanza VM.
- Puoi mostrare l'utilizzo della CPU per una specifica istanza VM filtrando la serie temporale per un singolo valore dell'etichetta
instance_id
. Puoi raggruppare le istanze VM in base all'etichetta
machine_type
e poi visualizzare l'utilizzo medio della CPU. Lo screenshot seguente illustra un grafico con questa configurazione:
Prezzi
In generale, le metriche di sistema di Cloud Monitoring sono gratuite, mentre quelle provenienti da sistemi, agenti o applicazioni esterni non lo sono. Le metriche fatturabili sono e fatturato in base al numero di byte o al numero di campioni importati.
Per ulteriori informazioni sui prezzi di Cloud Monitoring, consulta i seguenti documenti:
Passaggi successivi
- Per esplorare Cloud Monitoring, prova Guida rapida per il monitoraggio di un'istanza Compute Engine.
- Per informazioni su come configurare il nostro progetto Google Cloud per visualizzare per più progetti Google Cloud e account AWS, consulta Panoramica degli ambiti delle metriche.
Per informazioni sul modello di dati di Cloud Monitoring, consulta Metriche, serie temporali e risorse.
Per informazioni sull'API Cloud Monitoring, consulta la pagina relativa ad API e riferimenti.
Per gli elenchi di metriche e risorse monitorate, consulta l'elenco delle metriche. e Elenco delle risorse monitorate.