Questo documento fornisce una panoramica dei servizi che Cloud Monitoring fornisce. Questi servizi possono aiutarti a comprendere il comportamento, lo stato di salute e delle tue applicazioni e di altri servizi Google Cloud. Cloud Monitoring raccoglie e memorizza automaticamente le informazioni sulle prestazioni per la maggior parte dei servizi Google Cloud. Tu può raccogliere Prometheus mediante Google Cloud Managed Service per Prometheus. Se installi Ops Agent su Compute Engine di macchine virtuali (VM), puoi raccogliere metriche e log e quelle di terze parti.
I servizi di avviso, test e visualizzazione forniti Cloud Monitoring ti aiuta a rispondere a domande importanti come le seguenti:
- Qual è il carico sul mio servizio?
- Il mio sito web risponde correttamente?
- Il mio servizio è buono?
Cloud Monitoring fornisce il supporto sia della console sia dell'API Google Cloud per la maggior parte dei suoi servizi. Alcuni servizi supportano anche Google Cloud CLI
con Terraform. Le pagine di riferimento dell'API Cloud Monitoring, ad esempio la pagina
alertPolicies.list
,
ti consentono di sperimentare le chiamate API direttamente dalla pagina di riferimento.
Servizi di Cloud Monitoring
Cloud Monitoring offre diversi servizi che puoi utilizzare per comprendere l'integrità e le prestazioni delle tue applicazioni, da altri servizi Google Cloud che utilizzi.
Avvisi e notifiche
Ricevere notifiche quando il valore di una metrica di rendimento soddisfa i criteri definisci, crea un criterio di avviso. Il criterio di avviso include l'elenco di persone o gruppi che devono ricevere le notifiche. Monitoring supporta canali di notifica comuni, tra cui email, app mobile Cloud e servizi come PagerDuty o Slack. Ad esempio, potresti creare un criterio di avviso per ricevere una notifica quando l'utilizzo della CPU di una VM supera l'80%.
Ciascuna notifica include informazioni pertinenti su un errore e include un link a un incidente. Un incidente è un record permanente che archivia informazioni utili per risolvere l'errore. In genere, un record elenca lo stato dell'incidente, link ai log, un grafico della metrica registrata dati, etichette e durata.
Il servizio di avviso è integrato in molti servizi Google Cloud. Quando questi integrazioni esistenti, potresti visualizzare un riquadro con gli avvisi consigliati oppure potresti vedere un pulsante su un grafico che ti consente di creare un criterio di avviso. In entrambi i casi, i criteri di avviso sono preconfigurati, devi solo specificare l'elenco di persone o gruppi da avvisare.
Puoi creare e gestire criteri di avviso utilizzando la console Google Cloud, l'API Cloud Monitoring, Google Cloud CLI o Terraform.
Monitoraggio e convalida proattivi
Per testare la disponibilità, la coerenza e le prestazioni dei tuoi servizi, applicazioni, pagine web e API, monitor sintetici. Ad esempio: puoi verificare la reattività degli endpoint HTTP, HTTPS e TCP con controlli di uptime per poi ricevere una notifica quando l'endpoint non risponde. Puoi anche creare un strumento di verifica dei link inaccessibili per eseguire la scansione di una pagina web e poi ti avvisano quando vengono rilevati link inaccessibili.
Puoi creare e gestire monitoraggi sintetici utilizzando la console Google Cloud, l'API Cloud Monitoring, Google Cloud CLI o Terraform.
Visualizzazione dei dati
Per visualizzare i dati al fine di osservare le tendenze, identificare gli outlier e visualizzare altre i dettagli dei tuoi dati, puoi utilizzare dashboard e di grafici:
Il servizio dashboard crea automaticamente Dashboard gestita da Google Cloud quando aggiungi una risorsa al tuo progetto Google Cloud. Ad esempio, una dashboard viene creata quando crei un'istanza Compute Engine, un criterio di avviso o un monitoraggio sintetico. Puoi utilizzare questi dashboard per visualizzare informazioni sulle prestazioni e sulla configurazione, come utilizzo del disco o l'indirizzo IP e per visualizzare gli eventi.
Per controllare quali dati visualizzare e il relativo formato di visualizzazione: creare una dashboard personalizzata. Ad esempio: puoi importare una dashboard Grafana o installare una dashboard da un modello. Le dashboard personalizzate possono visualizzare grafici, tabelle, log e gruppi di errori, criteri di avviso e incidenti e testo. Puoi anche condividere dashboard personalizzate con persone o gruppi della tua organizzazione e configura queste dashboard display degli eventi.
Puoi creare e gestire le dashboard utilizzando la console Google Cloud o API.
Il servizio di grafici, Metrics Explorer, consente di visualizzare ed esplorare rapidamente i dati delle serie temporali. Le impostazioni del grafico ti consentono di confrontare i dati attuali con quelli precedenti, visualizzare valori anomali e percentile e più metriche. Puoi anche salvare i grafici in una dashboard personalizzata.
Raccolta e archiviazione dei dati
Cloud Monitoring raccoglie e archivia i seguenti tipi di dati delle metriche:
- Metriche di sistema generate dai servizi Google Cloud. Queste metriche forniscono informazioni sul funzionamento di un servizio.
- Metriche di sistema e delle applicazioni Ops Agent raccoglie informazioni sulle risorse di sistema e applicazioni in esecuzione sulle istanze di Compute Engine. Puoi configurare Ops Agent per raccogliere metriche da plug-in di terze parti come come i server web Apache o Nginx o i database MongoDB o PostgreSQL.
Le metriche definite dall'utente create utilizzando l'API Cloud Monitoring o una come OpenTelemetry.
Metriche esterne definite da alcune metriche open source biblioteche o fornitori di terze parti.
Metriche di Prometheus raccolte Google Cloud Managed Service per Prometheus, oppure utilizzando Ops Agent e Ricevitore Prometheus o ricevitore OTLP.
- Metriche basate su log che registrano informazioni numeriche su: i log scritti in Cloud Logging. Le metriche definite da Google basate su log includono conteggi degli errori rilevati dal servizio e il numero totale numero di voci di log ricevute dal tuo progetto Google Cloud. Puoi anche definire metriche basate su log.
Linguaggio per le query
Quando crei un criterio di avviso o un grafico, devi: fornisci una query che descriva i dati che vuoi monitorare o tracciare:
Console Google Cloud: puoi creare la query effettuando selezioni dai menu o scrivendola. Gli editor di query sono disponibili Prometheus Query Language (PromQL) e MQL (Monitoring Query Language). Gli editor di query forniscono controlli e suggerimenti sulla sintassi. Puoi anche scrivi un'espressione di filtro di monitoraggio.
API Cloud Monitoring: l'API supporta Prometheus Query Language (PromQL), query MQL ed espressioni di filtro di monitoraggio.
Monitora sistemi di grandi dimensioni
Questa sezione descrive come puoi gestire le risorse come e come monitorare le metriche archiviate più progetti Google Cloud.
Gestire le risorse come raccolta
Per gestire le tue risorse come raccolta anziché singolarmente, crea un gruppo di risorse. Un gruppo di risorse è una raccolta dinamica di risorse che soddisfano alcuni criteri da te indicati. Man mano che aggiungi e rimuovi risorse, aggiungendo ad esempio istanze VM di Compute Engine progetto Google Cloud, la partecipazione al gruppo cambia automaticamente. Ecco alcuni esempi di gruppi di risorse:
- Istanze di Compute Engine i cui nomi iniziano con la stringa
prod-
. - Risorse con il tag
test-cluster
. - Istanze Amazon EC2 nella regione A o nella regione B.
Dopo aver definito un gruppo di risorse, puoi monitorare il gruppo come se fosse una singola risorsa. Ad esempio, puoi configurare un controllo di uptime per monitorare un gruppo di risorse. Per i grafici e i criteri di avviso, puoi anche filtrare in base al nome del gruppo.
Per ulteriori informazioni, vedi Configurare i gruppi di risorse.
Monitora le metriche per più progetti Google Cloud
Per visualizzare e monitorare i dati delle serie temporali di più progetti Google Cloud e account AWS tramite un'unica interfaccia, configura un ambito delle metriche multi-progetto.
Per impostazione predefinita, le pagine di Cloud Monitoring nella console Google Cloud forniscono accesso solo alle serie temporali archiviate nel progetto di ambito. Il progetto di ambito è il progetto selezionato con il selettore di progetti della console Google Cloud. Progetto di definizione dell'ambito archivia avvisi, monitor sintetici, dashboard e gruppi di monitoraggio configurato.
Il progetto di definizione dell'ambito ospita anche un ambito delle metriche. L'ambito delle metriche definisce i progetti e gli account le cui metriche vengono visibile al progetto di definizione dell'ambito. Puoi configurare l'ambito delle metriche per includere i dati delle serie temporali di altri progetti Google Cloud e Account AWS. Per informazioni su come modificare un ambito delle metriche, consulta Configura un ambito delle metriche per più progetti.
Modello dei dati di Cloud Monitoring
Questa sezione introduce il modello dei dati di Cloud Monitoring:
Un tipo di metrica descrive qualcosa che misurata. Gli esempi di tipi di metriche includono l'utilizzo della CPU di una VM e percentuale di spazio di archiviazione usato.
Una serie temporale è una struttura di dati contenente misurazioni con timestamp di una metrica e informazioni sull'origine e significato di queste misurazioni.
Ecco alcuni dettagli sul contenuto di una serie temporale:
L'array
points
contiene le misurazioni con timestamp.Di seguito è riportato un esempio di array
points
con due valori:"points": [ { "interval": { "startTime": "2020-07-27T20:20:21.597143Z", "endTime": "2020-07-27T20:20:21.597143Z" }, "value": { "doubleValue": 0.473005 } }, { "interval": { "startTime": "2020-07-27T20:19:21.597239Z", "endTime": "2020-07-27T20:19:21.597239Z" }, "value": { "doubleValue": 0.473025 } }, ],
Per capire il significato di un valore, è necessario fare riferimento agli altri dati inclusi nelle serie temporali e alle relative definizioni.
Il campo
resource
descrive il componente hardware o software che viene monitorato. In Cloud Monitoring, l'hardware o il software viene definita risorsa monitorata. Alcuni esempi di risorse monitorate sono le istanze Compute Engine e le applicazioni App Engine. Per un elenco di per le risorse monitorate, consulta l'elenco delle risorse monitorate.Di seguito è riportato un esempio di campo
resource
:"resource": { "type": "gce_instance", "labels": { "instance_id": "2708613220420473591", "zone": "us-east1-b", "project_id": "sampleproject" } }
Il campo
type
elenca la risorsa monitorata comegce_instance
, il che indica che queste misurazioni vengono effettuate su un'istanza VM Compute Engine.Il campo
labels
contiene coppie chiave-valore che forniscono informazioni aggiuntive sulla risorsa monitorata. Per un tipogce_instance
, le etichette identificano l'istanza VM monitorata.
Il campo
metric
descrive cosa viene misurato.Di seguito è riportato un esempio di campo
metric
:"metric": { "labels": { "instance_name": "test" }, "type": "compute.googleapis.com/instance/cpu/utilization" },
- Per i servizi Google Cloud, il campo
type
specifica il servizio e la è in fase di monitoraggio. In questo esempio, il servizio Compute Engine la misurazione dell'utilizzo della CPU. Quando il campotype
inizia concustom
oexternal
, la metrica è una metrica personalizzata o una definita da una terza parte.
- Il campo
labels
contiene coppie chiave-valore che forniscono informazioni aggiuntive sulla misurazione. Queste etichette sono definite nell'ambito delMetricDescriptor
, una struttura di dati che definisce gli attributi dei dati misurati. IlMetricDescriptor
per la metricacompute.googleapis.com/instance/cpu/utilization
include l'etichettainstance_name
.
- Per i servizi Google Cloud, il campo
Il campo
metricKind
descrive la relazione tra misurazioni adiacenti in una serie temporale:Le metriche
GAUGE
memorizzano il valore dell'elemento misurata in un determinato momento, ad esempio una tariffa oraria della temperatura corporea.Le metriche
CUMULATIVE
memorizzano il valore accumulato dell'elemento misurato in un determinato momento, ad esempio un contachilometri in una veicolo.Le metriche
DELTA
memorizzano la variazione del valore dell'elemento misurato in un determinato periodo, ad esempio un riepilogo di un titolo che mostra le relative utili o perdite.
Il campo
valueType
descrive il tipo di dati per la misurazione:INT64
,DOUBLE
,BOOL
,STRING
oDISTRIBUTION
.
- Puoi mostrare l'utilizzo della CPU di ogni istanza VM.
- Puoi mostrare l'utilizzo della CPU per un'istanza VM specifica
filtrando le serie temporali per un singolo valore dell'etichetta
instance_id
. Puoi raggruppare le istanze VM in base all'etichetta
machine_type
e poi visualizzare l'utilizzo medio della CPU. Lo screenshot seguente illustra un grafico con questa configurazione:
Prezzi
In generale, le metriche di sistema di Cloud Monitoring sono gratuite, mentre quelle provenienti da sistemi, agenti o applicazioni esterni non lo sono. Le metriche fatturabili sono e fatturato in base al numero di byte o al numero di campioni importati.
Per ulteriori informazioni sui prezzi di Cloud Monitoring, consulta i seguenti documenti:
Passaggi successivi
- Per esplorare Cloud Monitoring, prova Guida rapida per il monitoraggio di un'istanza Compute Engine.
- Per informazioni su come configurare il nostro progetto Google Cloud per visualizzare per più progetti Google Cloud e account AWS, consulta Panoramica degli ambiti delle metriche.
Per informazioni sul modello dei dati di Cloud Monitoring, consulta Metriche, serie temporali e risorse.
Per informazioni sull'API Cloud Monitoring, consulta API e riferimenti.
Per gli elenchi di metriche e risorse monitorate, consulta l'elenco delle metriche. e Elenco delle risorse monitorate.