Osserva e monitora le VM

Questo documento descrive come accedere alle metriche delle macchine virtuali (VM) e visualizzarle. Descrive inoltre come esaminare le metriche delle VM per saperne di più sulle VM o per risolvere problemi specifici delle VM.

Il monitoraggio delle istanze delle macchine virtuali (VM) è essenziale per la manutenzione delle risorse VM. Compute Engine offre una visualizzazione generale delle metriche delle VM mediante la scheda Osservabilità nella console Google Cloud. Questa scheda fornisce una dashboard predefinita che utilizza i dati di telemetria per monitorare le VM e prendere decisioni informate sulle risorse Compute Engine. Puoi anche personalizzare la dashboard predefinita in modo da visualizzare solo le metriche specifiche che desideri.

Tutte le VM dispongono di dati di base sull'utilizzo dei processi al momento della creazione. Tuttavia, l'installazione di Ops Agent fornisce insight più approfonditi sul comportamento delle VM.

Per ulteriori informazioni sulla creazione di un criterio di avviso per il monitoraggio mediante l'uso di Metrics Explorer oppure per informazioni generali sul funzionamento del monitoraggio e delle metriche su Google Cloud, consulta i documenti di Cloud Monitoring.

Prima di iniziare

(Facoltativo) Installa Ops Agent per raccogliere dati più dettagliati dalle istanze Compute Engine.

Per verificare su quali istanze VM è installato Ops Agent:

  1. Nella console Google Cloud, vai a Monitoring Dashboards (Monitoraggio delle dashboard).

    Vai a Dashboard di Monitoring

  2. Seleziona Istanze VM dall'elenco della dashboard.

  3. Fai clic su Elenco per visualizzare le VM sotto forma di elenco.

    Vengono visualizzate tutte le VM nel tuo progetto. La colonna Agente mostra lo stato dell'installazione di Ops Agent. Puoi installare o aggiornare l'agente da questa pagina.

Accedi alle metriche di osservabilità delle VM

Accedi alle informazioni su una o più VM utilizzando la scheda Osservabilità nella console Google Cloud. Le metriche VM vengono visualizzate in una dashboard predefinita. Se vuoi visualizzare solo le metriche specifiche, puoi creare una dashboard personalizzata.

Visualizza metriche di osservabilità per una singola VM

Quando crei la VM, puoi disporre di metriche di base delle VM come l'utilizzo della CPU e il traffico di rete. Le metriche per l'utilizzo della memoria e dei processi sono disponibili solo con l'installazione di Ops Agent, l'agente principale per la raccolta dei dati di telemetria dalle istanze Compute Engine.

Per visualizzare le metriche per una singola VM:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Seleziona una VM per aprire la pagina Dettagli.

  3. Fai clic sulla scheda Osservabilità per visualizzare le informazioni sulla VM.

  4. (Facoltativo) Reimposta l'intervallo di tempo predefinito di un'ora sul periodo di tempo che vuoi monitorare.

Le informazioni nella Figura 1 mostrano i dettagli della VM senza che Ops Agent sia installato sulla VM. Tieni presente che i grafici Memoria e Utilizzo dello spazio su disco non contengono dati.

Scheda Osservabilità per una VM senza Ops Agent installato.
Figura 1: la scheda Osservabilità per una singola VM senza Ops Agent installato.

Visualizza metriche di osservabilità per più VM

L'osservabilità a livello di parco risorse mostra le metriche per le prime cinque VM con il massimo utilizzo dei processi. Le prime cinque VM elencate variano in base alla metrica. Potresti non vedere le stesse cinque VM per ogni processo. Anche se a livello di parco risorse sono disponibili più dati senza installare l'Ops Agent rispetto alla quantità di dati disponibili per una singola VM, l'installazione dell'agente fornisce una quantità maggiore di dati per la risoluzione dei problemi futuri.

Per visualizzare le metriche per più VM:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Fai clic sulla scheda Osservabilità.

  3. (Facoltativo) Reimposta l'intervallo di tempo predefinito di un'ora sul periodo di tempo che vuoi monitorare.

  4. Filtra i risultati in base a una o più delle seguenti opzioni:

    • ID
    • Nome
    • Tipo di macchina
    • Zona
    • Regione
    • Gruppo di istanze
    • Etichette
    • Stato

Le informazioni nella Figura 2 mostrano un esempio della scheda Osservabilità quando Ops Agent è installato su più VM in un progetto. Nota che sono disponibili altre metriche per queste VM.

Più istanze VM con Ops Agent installato.
Figura 2: più istanze VM con Ops Agent installato.

Visualizza metriche dettagliate per una VM

Ogni metrica di processo VM è rappresentata da una linea in un grafico. Nell'esempio seguente, Ops Agent è installato nella VM uptime-demo. I dati sull'utilizzo della memoria sono disponibili per la risoluzione dei problemi. Se una VM non è elencata nella scheda, filtra in base al nome della VM per trovarne una specifica.

Per recuperare le informazioni su questa VM o su un'altra delle prime cinque VM dalla scheda Osservabilità, segui questi passaggi:

  1. Tieni il puntatore sulla linea del grafico di qualsiasi VM. Viene visualizzata una scheda con un elenco delle prime cinque VM che utilizzano il processo, ognuna con una metrica.
  2. Per saperne di più sul comportamento della VM, fai clic sulla linea del grafico della VM o sul nome di una VM specifica nell'elenco.

La VM uptime-demo visualizzata nella scheda della Figura 3 rivela alcune metriche che potrebbero richiedere una revisione.

La linea del grafico rappresenta una VM. Fai clic per saperne di più su una VM specifica.
Figura 3: la linea del grafico rappresenta una VM. Fai clic per saperne di più su una VM specifica.

Fai clic sulla VM uptime-demo per aprire la pagina Dettagli VM visualizzata nella Figura 4, che fornisce le seguenti informazioni:

  • Lo stato di Ops Agent.
  • Le opzioni contestualizzate per creare avvisi, verificare la presenza di eventi o creare controlli di uptime.
  • L'opzione per visualizzare i dettagli di configurazioni, metriche e log della VM.
La pagina dei dettagli della VM fornisce informazioni su una VM specifica.
Figura 4: la pagina Dettagli VM fornisce informazioni su una VM specifica.

Crea una dashboard personalizzata per visualizzare metriche specifiche

Per impostazione predefinita, la scheda Osservabilità in Compute Engine fornisce una dashboard predefinita che mostra le metriche di base delle VM. Per visualizzare solo le metriche specifiche che desideri, puoi modificare la dashboard predefinita e salvarla come dashboard personalizzata. Puoi personalizzare la dashboard a piacimento.

Per creare una dashboard personalizzata:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Vai alla scheda Osservabilità come segue:

    • Per una singola VM: nella pagina Istanze VM, fai clic sul nome della VM per aprire la pagina Dettagli, quindi fai clic sulla scheda Osservabilità della VM.
    • Per più VM: nella pagina Istanze VM, fai clic sulla scheda Osservabilità.
  3. Se il menu a discesa Dashboard è abilitato, sono disponibili dashboard personalizzate. Per modificare una visualizzazione personalizzata, seleziona una visualizzazione personalizzata dal menu a discesa e fai clic su nella barra degli strumenti della dashboard.

  4. Altrimenti, per personalizzare la dashboard predefinita, fai clic su nella barra degli strumenti della dashboard.

    Compute Engine crea una copia della dashboard predefinita, quindi apre la copia in modalità di modifica.

  5. Nell'editor puoi aggiungere, modificare, eliminare, riposizionare o ridimensionare le visualizzazioni nella dashboard. Le visualizzazioni sono chiamate collettivamente widget. Per ulteriori informazioni sui diversi tipi di widget, consulta la panoramica delle dashboard.

    • Per aggiungere un widget, fai clic su Aggiungi widget nella barra degli strumenti della dashboard e completa la configurazione.

      Ad esempio, per visualizzare i log con i dati delle metriche, fai clic su Aggiungi widget, seleziona Log e fai clic su Applica.

    • Per modificare un widget, posiziona il puntatore sul widget per attivare la barra degli strumenti, fai clic su Modifica widget, quindi utilizza la finestra di dialogo Configura widget. Per applicare le modifiche alla dashboard, fai clic su Applica nella barra degli strumenti. Per ignorare le modifiche, fai clic su Annulla.

    • Per eliminare un widget, posiziona il puntatore sul widget per attivare la barra degli strumenti, fai clic su Altre opzioni del grafico e seleziona Elimina.

    • Per riposizionare un widget, utilizza il puntatore per trascinare il widget dalla sua intestazione in una nuova posizione.

    • Per ridimensionare un widget, utilizza il puntatore per riposizionare l'angolo destro del widget.

  6. Dopo aver completato la modifica della dashboard, fai clic su Salva.

  7. Nella finestra di dialogo che conferma le modifiche, fai clic su Visualizza dashboard personalizzata per passare alla visualizzazione personalizzata.

    Puoi tornare alla visualizzazione predefinita selezionando Predefinito dal menu a discesa Dashboard.

Esamina le metriche delle risorse

Per saperne di più su ciascuna metrica delle risorse, fai clic su ciascun processo nel menu della scheda Osservabilità:

  • Esplora l'utilizzo di CPU, processi, memoria, traffico di rete e utilizzo del disco.
  • Visualizza i dati dei log cercando Log per identificare e visualizzare gli eventi di sistema.
  • Aggiungi integrazioni di terze parti e verifica se sono presenti integrazioni configurate.

Il resto di questa sezione descrive esempi di come alcuni processi potrebbero influire sui carichi di lavoro. Queste informazioni presuppongono che l'Ops Agent sia installato sulle tue VM.

Utilizzo CPU

Un esempio di utilizzo estremo della CPU può essere quando un server si trova sotto un carico inaspettatamente pesante, ad esempio quando un sito web subisce un picco improvviso del traffico o quando è in corso un'attività di elaborazione dati su larga scala. In questi situazioni, la CPU potrebbe essere in esecuzione al 100% della capacità per un periodo di tempo prolungato, il che può causare un rallentamento del server o la mancata risposta.

In questo esempio, il problema è la saturazione. Se l'utilizzo della CPU è al 100%, potrebbe andare bene per i tuoi carichi di lavoro, ma potresti voler esaminare altre metriche per capire se questo richiede un intervento. In questo caso, potrebbe essere opportuno creare un criterio di avviso per ricevere una notifica quando si verifica un picco di utilizzo della CPU di una VM.

Con le autorizzazioni appropriate, puoi connetterti alle tue VM tramite SSH per esaminare il problema. Tuttavia, se Ops Agent è installato, puoi visualizzare altri dati storici per aiutarti a risolvere i problemi.

Utilizzo dei processi

Un esempio di comportamento estremo dei processi può essere quando un processo consuma una quantità eccessiva di risorse, come CPU, memoria o I/O del disco, al punto tale che ne causa un peggioramento delle prestazioni o addirittura arresta la VM.

Ad esempio, se un processo in esecuzione su una VM riscontra una perdita di memoria, nel tempo potrebbe iniziare a consumare una quantità sempre maggiore di memoria, causando l'esaurimento della memoria e l'arresto anomalo della VM. Allo stesso modo, se un processo fa un uso intensivo del disco, può causare la saturazione dell'I/O del disco della VM, con un conseguente rallentamento dei tempi di risposta per altri processi.

Utilizzo memoria

I database richiedono una grande quantità di memoria per eseguire operazioni come l'indicizzazione, l'ordinamento e l'unione delle tabelle.

Un esempio di utilizzo elevato della memoria su una VM è l'esecuzione di un server di database, come Cloud SQL per MySQL o Cloud SQL per PostgreSQL, con un set di dati di grandi dimensioni. Se la memoria disponibile della VM è troppo piccola, il ricaricamento di un set di dati in memoria può causare un rallentamento del database o un arresto anomalo.

Rendimento della rete

I problemi di prestazioni della rete sono il risultato di diversi fattori: congestione, limitazioni della larghezza di banda, problemi di hardware o software e latenza. Per diagnosticare il problema, monitora le metriche delle prestazioni della rete, risolvi i problemi di hardware e software e analizza i pattern di traffico di rete per identificare e risolvere la causa principale del problema.

Utilizzo disco

Un elevato utilizzo del disco su una VM si verifica quando è presente una grande quantità di dati in fase di lettura o scrittura dal disco virtuale, con un ritardo nell'accesso al disco e un possibile effetto sulle prestazioni della VM.

Il monitoraggio delle metriche di utilizzo del disco come le operazioni di I/O del disco al secondo (IOPS), la lunghezza della coda del disco e il tempo di risposta medio del disco può essere utile per identificare e diagnosticare problemi di utilizzo elevato del disco su una VM.

Controllare i log e gli eventi di sistema

La pagina Tutti i log fornisce dati di log sulle risorse. Ordina i dati per gravità per identificare i problemi e ispezionare il payload.

Gli audit log registrano gli eventi amministrativi che si verificano nelle risorse. I log possono indicare cosa è successo che ha attivato l'evento. Più log vengono registrati e conservati nella stessa riga; di conseguenza, se hai 20 log identici, le informazioni vengono archiviate in un'unica riga anziché in 20 righe separate.

Eventi di sistema è un termine generico che indica gli eventi che si verificano a un livello superiore, ma che potrebbero influire sulle risorse Compute Engine. Un evento di sistema si verifica quando si attiva un errore non correlato a un evento pianificato. Gli eventi di sistema vengono registrati a livello di parco risorse.

Utilizzare integrazioni di terze parti

Monitoring fornisce integrazioni con applicazioni di terze parti. Queste integrazioni consentono di raccogliere dati di telemetria da applicazioni come il server web Apache, Cloud SQL per MySQL, Memorystore for Redis e altre per i deployment in esecuzione su Compute Engine e GKE. Quando utilizzi Compute Engine, Ops Agent raccoglie i dati di telemetria di terze parti.

Passaggi successivi