Panoramica di Cloud Monitoring

Questo documento fornisce una panoramica dei servizi che Cloud Monitoring fornisce. Questi servizi possono aiutarti a comprendere il comportamento, lo stato di salute e delle tue applicazioni e di altri servizi Google Cloud. Cloud Monitoring raccoglie e archivia automaticamente le informazioni sulle prestazioni per la maggior parte dei servizi Google Cloud. Tu può raccogliere Prometheus mediante Google Cloud Managed Service per Prometheus. Se installi Ops Agent su Compute Engine di macchine virtuali (VM), puoi raccogliere metriche e log e quelle di terze parti.

I servizi di avviso, test e visualizzazione forniti Cloud Monitoring ti aiuta a rispondere a domande importanti come le seguenti:

  • Qual è il carico sul mio servizio?
  • Il mio sito web risponde correttamente?
  • Il mio servizio è buono?

Cloud Monitoring offre il supporto sia per la console Google Cloud che per le API per la maggior parte delle e i suoi servizi. Alcuni servizi supportano anche Google Cloud CLI con Terraform. Le pagine di riferimento dell'API Cloud Monitoring, ad esempio la pagina alertPolicies.list, ti consentono di sperimentare le chiamate API direttamente dalla pagina di riferimento.

Servizi di Cloud Monitoring

Cloud Monitoring offre diversi servizi che puoi utilizzare per comprendere l'integrità e le prestazioni delle tue applicazioni, da altri servizi Google Cloud che utilizzi.

Avvisi e notifiche

Ricevere notifiche quando il valore di una metrica di rendimento soddisfa i criteri definisci, crea un criterio di avviso. Il criterio di avviso include l'elenco di persone o gruppi che devono ricevere le notifiche. Monitoring supporta canali di notifica comuni, tra cui email, app mobile Cloud e servizi come PagerDuty o Slack. Ad esempio, potresti creare un criterio di avviso per ricevere una notifica quando l'utilizzo della CPU di una VM supera l'80%.

Ciascuna notifica include informazioni pertinenti su un errore e include un link a un incidente. Un incidente è un record permanente che archivia informazioni utili per risolvere l'errore. In genere, un record elenca lo stato dell'incidente, link ai log, un grafico della metrica registrata dati, etichette e durata.

Il servizio di avviso è integrato in molti servizi Google Cloud. Quando questi integrazioni esistenti, potresti visualizzare un riquadro con gli avvisi consigliati oppure potresti vedere un pulsante su un grafico che ti consente di creare un criterio di avviso. In entrambi i casi, i criteri di avviso sono preconfigurati, devi specificare solo l'elenco di persone o gruppi a cui inviare le notifiche.

Puoi creare e gestire criteri di avviso utilizzando la console Google Cloud, l'API Cloud Monitoring, Google Cloud CLI o Terraform.

Monitoraggio e convalida proattivi

Per testare la disponibilità, la coerenza e le prestazioni dei tuoi servizi, applicazioni, pagine web e API, monitor sintetici. Ad esempio: puoi verificare la reattività degli endpoint HTTP, HTTPS e TCP con controlli di uptime per poi ricevere una notifica quando l'endpoint non risponde. Puoi anche creare un strumento di verifica dei link inaccessibili per eseguire la scansione di una pagina web e poi ti avvisano quando vengono rilevati link inaccessibili.

Puoi creare e gestire monitoraggi sintetici utilizzando la console Google Cloud, l'API Cloud Monitoring, Google Cloud CLI o Terraform.

Visualizzazione dei dati

Per visualizzare i dati al fine di osservare le tendenze, identificare gli outlier e visualizzare altre i dettagli dei tuoi dati, puoi utilizzare dashboard e grafici:

Raccolta e archiviazione dei dati

Cloud Monitoring raccoglie e archivia i seguenti tipi di dati delle metriche:

  • Metriche basate su log che registrano informazioni numeriche su: i log scritti in Cloud Logging. Le metriche definite da Google basate su log includono conteggi degli errori rilevati dal servizio e il numero totale numero di voci di log ricevute dal tuo progetto Google Cloud. Puoi anche definire metriche basate su log.

Linguaggio per le query

Quando crei un criterio di avviso o un grafico, devi: fornisci una query che descriva i dati che vuoi monitorare o tracciare:

  • Console Google Cloud: puoi creare la query effettuando selezioni da menu, oppure scrivere una query. Gli editor di query sono disponibili Prometheus Query Language (PromQL) e MQL (Monitoring Query Language). Gli editor delle query per fornire controlli della sintassi e suggerimenti. Puoi anche scrivi un'espressione di filtro di monitoraggio.

  • API Cloud Monitoring: l'API supporta Prometheus Query Language (PromQL), query MQL ed espressioni di filtro di Monitoring.

Monitora sistemi di grandi dimensioni

Questa sezione descrive come puoi gestire le risorse come e come monitorare le metriche archiviate più progetti Google Cloud.

Gestione delle risorse come raccolta

Per gestire le tue risorse come raccolta anziché singolarmente, crea un gruppo di risorse. Un gruppo di risorse è una raccolta dinamica di risorse che soddisfano alcuni criteri da te indicati. Man mano che aggiungi e rimuovi risorse, aggiungendo ad esempio istanze VM di Compute Engine progetto Google Cloud, la partecipazione al gruppo cambia automaticamente. Ecco alcuni esempi di gruppi di risorse:

  • Istanze di Compute Engine i cui nomi iniziano con la stringa prod-.
  • Risorse con il tag test-cluster.
  • Istanze Amazon EC2 nella regione A o nella regione B.

Dopo aver definito un gruppo di risorse, puoi monitorare il gruppo come se fosse una singola risorsa. Ad esempio, puoi configurare un controllo di uptime per monitorare un gruppo di risorse. Per i grafici e i criteri di avviso, puoi anche filtrare in base al nome del gruppo.

Per saperne di più, consulta Configurare i gruppi di risorse.

Monitora le metriche per più progetti Google Cloud

Per visualizzare e monitorare i dati delle serie temporali per più i progetti Google Cloud e gli account AWS tramite un'unica interfaccia, Configura un ambito delle metriche multiprogetto.

Per impostazione predefinita, le pagine di Cloud Monitoring nella console Google Cloud forniscono accesso solo alle serie temporali archiviate nel progetto di ambito. La il progetto di definizione dell'ambito è il progetto che hai selezionato con Selettore progetti della console Google Cloud. Progetto di definizione dell'ambito archivia avvisi, monitor sintetici, dashboard e gruppi di monitoraggio configurato.

Il progetto di definizione dell'ambito ospita anche un ambito delle metriche. L'ambito delle metriche definisce i progetti e gli account le cui metriche vengono visibile al progetto di definizione dell'ambito. Puoi configurare l'ambito delle metriche per includere i dati delle serie temporali di altri progetti Google Cloud e Account AWS. Per informazioni su come modificare un ambito delle metriche, consulta Configura un ambito delle metriche per più progetti.

Modello dei dati di Cloud Monitoring

Questa sezione introduce il modello dei dati di Cloud Monitoring:

  • Un tipo di metrica descrive qualcosa che misurata. Gli esempi di tipi di metriche includono l'utilizzo della CPU di una VM e percentuale di spazio di archiviazione usato.

  • Una serie temporale è una struttura di dati contenente misurazioni con timestamp di una metrica e informazioni sull'origine e significato di queste misurazioni.

Ecco alcuni dettagli sul contenuto di una serie temporale:

  • L'array points contiene le misurazioni con timestamp.

    Di seguito è riportato un esempio di array points con due valori:

      "points": [
        {
          "interval": {
            "startTime": "2020-07-27T20:20:21.597143Z",
            "endTime": "2020-07-27T20:20:21.597143Z"
          },
          "value": {
            "doubleValue": 0.473005
          }
        },
        {
          "interval": {
            "startTime": "2020-07-27T20:19:21.597239Z",
            "endTime": "2020-07-27T20:19:21.597239Z"
          },
          "value": {
            "doubleValue": 0.473025
          }
        },
      ],
    

    Per capire il significato di un valore, è necessario fare riferimento agli altri dati inclusi nelle serie temporali e alle relative definizioni.

  • Il campo resource descrive il componente hardware o software che viene monitorato. In Cloud Monitoring, l'hardware o il software viene definita risorsa monitorata. Tra gli esempi di risorse monitorate c'è Compute Engine di deployment e applicazioni App Engine. Per un elenco di per le risorse monitorate, consulta l'elenco delle risorse monitorate.

    Di seguito è riportato un esempio di campo resource:

      "resource": {
        "type": "gce_instance",
        "labels": {
          "instance_id": "2708613220420473591",
          "zone": "us-east1-b",
          "project_id": "sampleproject"
        }
      }
    
    • Il campo type elenca la risorsa monitorata come gce_instance, che indica che vengono effettuate su un'istanza VM di Compute Engine.

    • Il campo labels contiene coppie chiave-valore che forniscono dati aggiuntivi sulla risorsa monitorata. Per un tipo gce_instance, le etichette identificano l'istanza VM monitorata.

  • Il campo metric descrive cosa viene misurato.

    Di seguito è riportato un esempio di campo metric:

      "metric": {
        "labels": {
          "instance_name": "test"
        },
        "type": "compute.googleapis.com/instance/cpu/utilization"
      },
    
    • Per i servizi Google, il campo type specifica il servizio e cosa è in fase di monitoraggio. In questo esempio, il servizio Compute Engine la misurazione dell'utilizzo della CPU. Quando il campo type inizia con custom o external, la metrica è una metrica personalizzata o una definita da una terza parte.

    • Il campo labels contiene coppie chiave-valore che forniscono dati aggiuntivi informazioni sulla misurazione. Queste etichette sono definite come parte MetricDescriptor, una struttura di dati che definisce gli attributi dei dati misurati. MetricDescriptor per la metrica compute.googleapis.com/instance/cpu/utilization include l'etichetta instance_name.

  • Il campo metricKind descrive la relazione tra misurazioni adiacenti in una serie temporale:

    • Le metriche GAUGE memorizzano il valore dell'elemento misurata in un determinato momento, ad esempio una tariffa oraria la registrazione della temperatura corporea.

    • Le metriche CUMULATIVE memorizzano il valore accumulato dell'elemento misurato in un determinato momento, ad esempio un contachilometri in una veicolo.

    • Le metriche DELTA memorizzano la variazione del valore dell'elemento misurata nel corso di un determinato periodo, ad esempio un'azione riepilogo che mostra i guadagni o le perdite dell'azione.

  • Il campo valueType descrive il tipo di dati per l'attributo misurazione: INT64, DOUBLE, BOOL, STRING o DISTRIBUTION.

Cloud Monitoring scrive una serie temporale per ogni combinazione di valori delle etichette delle risorse e delle metriche. Puoi utilizzare queste etichette per raggruppare e filtrare serie temporali. Ad esempio, quando un progetto Google Cloud contiene più alle istanze VM di Compute Engine, l'utilizzo della CPU per ogni istanza VM è una serie temporale unica. Ecco alcuni modi per visualizzare queste informazioni dati:

  • Puoi mostrare l'utilizzo della CPU di ogni istanza VM.
  • Puoi mostrare l'utilizzo della CPU per un'istanza VM specifica filtrando le serie temporali per un singolo valore dell'etichetta instance_id.
  • Puoi raggruppare in base alle istanze VM in base all'etichetta machine_type, e poi visualizzerai l'utilizzo medio della CPU. Il seguente screenshot mostra un grafico con questa configurazione:

    Utilizzo medio della CPU raggruppato per tipo di macchina.

Prezzi

In generale, le metriche di sistema di Cloud Monitoring sono gratuite, mentre da sistemi, agenti o applicazioni esterni. Le metriche fatturabili sono e fatturato in base al numero di byte o al numero di campioni importati.

Per ulteriori informazioni sui prezzi di Cloud Monitoring, consulta i seguenti documenti:

Passaggi successivi