Osserva e monitora le VM


Questo documento descrive come accedere e visualizzare le metriche delle macchine virtuali (VM). Inoltre, descrive come esaminare le metriche delle VM per scoprire di più sulle tue VM o risolvere problemi specifici relativi a una VM.

Il monitoraggio delle istanze di macchine virtuali (VM) è essenziale per mantenere le risorse delle VM. Compute Engine offre una visualizzazione di alto livello delle tue metriche VM utilizzando la scheda Osservabilità nella console Google Cloud. Questa scheda fornisce una dashboard predefinita che utilizza i dati di telemetria per consentirti di monitorare le VM e prendere decisioni consapevoli sulle risorse Compute Engine. Puoi anche personalizzare la dashboard predefinita in modo da visualizzare solo le metriche specifiche che ti interessano.

Per tutte le VM sono disponibili dati di base sull'utilizzo dei processi al momento della loro creazione. Tuttavia, l'installazione di Ops Agent offre informazioni più approfondite sul comportamento della VM.

Per ulteriori informazioni sulla creazione di un criterio di avviso di monitoraggio, sull'utilizzo di Metrics Explorer o per informazioni generali su come funzionano il monitoraggio e le metriche su Google Cloud, consulta la documentazione di Cloud Monitoring.

Prima di iniziare

(Facoltativo) Installa Ops Agent per raccogliere dati più dettagliati dalle istanze Compute Engine.

Per verificare su quali istanze VM è installato l'Ops Agent:

  1. Nella console Google Cloud, vai a Dashboard di monitoraggio.

    Vai a Dashboard di Monitoring

  2. Seleziona Istanze VM dall'elenco della dashboard.

  3. Fai clic su Elenco per visualizzare le VM sotto forma di elenco.

    Vengono visualizzate tutte le VM del progetto. La colonna Agente mostra lo stato dell'installazione di Ops Agent. Puoi installare o aggiornare l'agente da questa pagina.

  4. (Facoltativo) Per aggiornare la dashboard Predefinita in modo da visualizzare gli eventi, ad esempio quelli che indicano un aggiornamento a un gruppo di istanze gestite, fai clic su Seleziona eventi e poi completa la finestra di dialogo.

    Per saperne di più sugli eventi, consulta Tipi di eventi.

Accedere alle metriche di osservabilità delle VM

Accedi alle informazioni relative a una o più VM utilizzando la scheda Osservabilità nella console Google Cloud. Per impostazione predefinita, una dashboard predefinita mostra le metriche delle VM. Se vuoi visualizzare solo le metriche specifiche che ti interessano, puoi creare una dashboard personalizzata.

Visualizzare le metriche di osservabilità per una singola VM

Quando crei una VM, hai a disposizione le metriche di base della VM, come l'utilizzo della CPU e il traffico di rete. Le metriche per l'utilizzo della memoria e dei processi sono disponibili solo con l'installazione di Ops Agent, l'agente principale per la raccolta dei dati di telemetria dalle istanze Compute Engine.

Per visualizzare le metriche di una singola VM:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Seleziona una VM per aprire la pagina Dettagli.

  3. Fai clic sulla scheda Osservabilità per visualizzare le informazioni sulla VM.

  4. (Facoltativo) Reimposta l'intervallo di tempo predefinito di un'ora sull'intervallo di tempo che vuoi monitorare.

  5. (Facoltativo) Per aggiornare la dashboard Predefinita in modo da visualizzare gli eventi, ad esempio quelli che indicano un aggiornamento a un gruppo di istanze gestite, fai clic su Seleziona eventi e poi completa la finestra di dialogo.

    Per saperne di più sugli eventi, consulta Tipi di eventi.

Le informazioni riportate nella Figura 1 mostrano i dettagli della VM senza Ops Agent installato. Tieni presente che i grafici Memoria e Utilizzo dello spazio su disco non contengono dati.

Scheda Osservabilità per una VM senza Ops Agent installato.
Figura 1: la scheda Osservabilità per una singola VM senza Ops Agent installato.

Visualizzare le metriche di osservabilità per più VM

L'osservabilità a livello di parco risorse mostra le metriche delle cinque VM con il maggiore utilizzo dei processi. Le cinque VM principali elencate variano in base alla metrica. Potresti non vedere le stesse cinque VM per ogni processo. Sebbene a livello di parco sia possibile trovare più dati senza installare Ops Agent rispetto alla quantità di dati disponibili per una singola VM, l'installazione dell'agente fornisce più dati per la risoluzione dei problemi futuri.

Per visualizzare le metriche di più VM:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Fai clic sulla scheda Osservabilità.

  3. (Facoltativo) Reimposta l'intervallo di tempo predefinito di un'ora sull'intervallo di tempo che vuoi monitorare.

  4. Filtra i risultati in base a una o più delle seguenti opzioni:

    • ID
    • Nome
    • Tipo di macchina
    • Zona
    • Regione
    • Gruppo di istanze
    • Etichette
    • Stato

Le informazioni riportate nella Figura 2 mostrano un esempio della scheda Osservabilità quando su più VM di un progetto è installato Ops Agent. Tieni presente che sono disponibili altre metriche su queste VM.

Più istanze VM con Ops Agent installato.
Figura 2: più istanze VM con Ops Agent installato.

Visualizzare metriche dettagliate per una VM

Ogni metrica del processo VM è rappresentata da una linea del grafico in un grafico. Nel seguente esempio, nella VM uptime-demo è installato Ops Agent. I dati sull'utilizzo della memoria sono disponibili per la risoluzione dei problemi. Se una VM non è elencata nella scheda, filtra in base al nome della VM per trovarne una specifica.

Per recuperare le informazioni su questa VM o su un'altra delle cinque VM principali dalla scheda Osservabilità, procedi nel seguente modo:

  1. Tieni il puntatore sopra la linea del grafico di qualsiasi VM. Viene visualizzata una scheda con un elenco delle cinque VM principali che utilizzano il processo, ciascuna con una metrica.
  2. Per scoprire di più sul comportamento della VM, fai clic sulla riga del grafico della VM o su un nome VM specifico nell'elenco.

La VM uptime-demo visualizzata nella scheda della Figura 3 rivela alcune metriche che potrebbero richiedere una revisione.

La linea del grafico rappresenta una VM. Fai clic per visualizzare ulteriori informazioni su una VM specifica.
Figura 3: la linea del grafico rappresenta una VM. Fai clic per approfondire una VM specifica.

Fai clic sulla VM uptime-demo per aprire la pagina Dettagli VM mostrata nella Figura 4, che fornisce le seguenti informazioni:

  • Lo stato dell'agente operativo.
  • Le opzioni contestuali per creare avvisi, controllare la presenza di eventi o creare controlli di uptime.
  • L'opzione per visualizzare i dettagli delle configurazioni, delle metriche e dei log della VM.
La pagina VM
 dettagli fornisce informazioni su una VM specifica.
Figura 4: la pagina Dettagli VM fornisce informazioni su una VM specifica.

Creare una dashboard personalizzata per visualizzare metriche specifiche

Per impostazione predefinita, la scheda Osservabilità in Compute Engine fornisce una dashboard predefinita che mostra le metriche di base delle VM. Per visualizzare solo le metriche specifiche che vuoi vedere, puoi modificare la dashboard predefinita e salvarla come dashboard personalizzata. Puoi personalizzare la dashboard come preferisci.

Per creare una dashboard personalizzata:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Vai alla scheda Osservabilità come segue:

    • Per una singola VM: nella pagina Istanze VM, fai clic sul nome della VM per aprire la pagina Dettagli e poi sulla scheda Osservabilità per la VM.
    • Per più VM: nella pagina Istanze VM, fai clic sulla scheda Osservabilità.
  3. Se il menu a discesa Dashboard è abilitato, sono disponibili dashboard personalizzate. Per modificare una visualizzazione personalizzata, selezionala dal menu a discesa, poi fai clic su nella barra degli strumenti della dashboard.

  4. In caso contrario, per personalizzare la dashboard predefinita, fai clic su nella barra degli strumenti della dashboard.

    Compute Engine crea una copia della dashboard predefinita, quindi la apre in modalità di modifica.

  5. Nell'editor puoi aggiungere, modificare, eliminare, riposizionare o ridimensionare le visualizzazioni nella dashboard. Le visualizzazioni sono chiamate collettivamente widget. Per ulteriori informazioni sui diversi tipi di widget, consulta la Panoramica delle dashboard.

    • Per aggiungere un widget, fai clic su Aggiungi widget nella barra degli strumenti della dashboard e completa la configurazione.

      Ad esempio, per visualizzare i log con i dati delle metriche, fai clic su Aggiungi widget, selezionare Log e poi fai clic su Applica.

    • Per modificare un widget, posiziona il cursore sul widget per attivare la barra degli strumenti, fai clic su Modifica widget e utilizza la finestra di dialogo Configura widget. Per applicare le modifiche alla dashboard, nella barra degli strumenti fai clic su Applica. Per ignorare le modifiche, fai clic su Annulla.

    • Per eliminare un widget, posiziona il cursore sul widget per attivare la barra degli strumenti, fai clic su Altre opzioni di grafico e seleziona Elimina.

    • Per riposizionare un widget, utilizza il cursore per trascinarlo per l'intestazione in una nuova posizione.

    • Per ridimensionare un widget, utilizza il cursore per riposizionare l'angolo a destra del widget.

  6. Al termine della modifica della dashboard, fai clic su Salva.

  7. Nella finestra di dialogo di conferma delle modifiche, fai clic su Visualizza dashboard personalizzata per passare alla visualizzazione personalizzata.

    Per tornare alla visualizzazione predefinita, seleziona Predefinita dal menu a discesa Dashboard.

Esamina le metriche delle risorse

Per saperne di più su ogni metrica delle risorse, fai clic su ogni processo nel menu della scheda Osservabilità:

  • Esplora l'utilizzo di CPU, Processi, Memoria, il traffico di Rete e l'utilizzo del Disco.
  • Visualizza i dati dei log cercando Log per identificare e visualizzare Eventi di sistema.
  • Aggiungi Integrazioni di terze parti e controlla se sono presenti integrazioni configurate.

Nella parte rimanente di questa sezione vengono descritti esempi di come alcune procedure potrebbero influire sui tuoi carichi di lavoro. Queste informazioni presuppongono che Ops Agent sia installato sulle tue VM.

Utilizzo CPU

Un esempio di utilizzo estremo della CPU potrebbe essere quando un server è sottoposto a un carico inaspettatamente elevato, ad esempio quando un sito web registra un improvviso picco di traffico o quando è in corso un'attività di elaborazione dei dati su larga scala. In queste situazioni, la CPU potrebbe funzionare al 100% della sua capacità per un periodo di tempo prolungato, il che può causare il rallentamento del server o la sua mancata risposta.

In questo esempio, il problema è la saturazione. Se l'utilizzo della CPU è al 100%, potrebbe essere sufficiente per i tuoi carichi di lavoro, ma ti consigliamo di esaminare altre metriche per capire se è necessario intervenire. In questo caso, ti consigliamo di creare un criterio di avviso per ricevere una notifica quando l'utilizzo della CPU di una VM aumenta.

Con le autorizzazioni appropriate, puoi connetterti tramite SSH alle tue VM per esaminare il problema. Tuttavia, se Ops Agent è installato, puoi visualizzare più dati storici per aiutarti a risolvere i problemi.

Utilizzo del processo

Un esempio di comportamento estremo del processo potrebbe essere quando un processo consuma una quantità eccessiva di risorse come CPU, memoria o I/O del disco, al punto da causare un calo delle prestazioni o addirittura arresti anomali della VM.

Ad esempio, se un processo in esecuzione su una VM presenta una perdita di memoria, potrebbe iniziare a consumare quantità sempre maggiori di memoria nel tempo, provocando infine l'esaurimento della memoria della VM e un arresto anomalo. Analogamente, se un processo utilizza molto il disco, l'I/O del disco della VM può diventare saturo, con tempi di risposta lenti per altri processi.

Utilizzo memoria

I database richiedono una grande quantità di memoria per eseguire operazioni come indicizzazione, ordinamento e unione di tabelle.

Un esempio di utilizzo elevato della memoria su una VM è quando esegui un server di database, come Cloud SQL per MySQL o Cloud SQL per PostgreSQL, con un set di dati di grandi dimensioni. Se la memoria disponibile della VM è troppo piccola, il ricaricamento di un set di dati nella memoria può causare il rallentamento o l'arresto anomalo del database.

Prestazioni della rete

I problemi di prestazioni della rete sono dovuti a diversi fattori: congestione, limitazioni della larghezza di banda, problemi hardware o software e latenza. Per diagnosticare il problema, monitora le metriche relative alle prestazioni della rete, risolvi i problemi hardware e software e analizza i pattern di traffico di rete per identificare e risolvere la causa principale del problema.

Utilizzo del disco

Un utilizzo elevato del disco su una VM si verifica quando viene letta o scritta una grande quantità di dati sul disco virtuale, con un ritardo nell'accesso al disco e un possibile effetto sulle prestazioni della VM.

Il monitoraggio delle metriche di utilizzo del disco, come le operazioni di I/O del disco al secondo (IOPS), la lunghezza della coda del disco e il tempo di risposta medio del disco, può aiutarti a identificare e diagnosticare i problemi di utilizzo elevato del disco su una VM.

Controllare i log e gli eventi di sistema

La pagina Tutti i log fornisce i dati dei log relativi alle tue risorse. Ordina per gravità per identificare i problemi e ispezionare il payload.

Gli audit log registrano gli eventi amministrativi che si verificano nelle tue risorse. I log possono indicare cosa è successo per attivare l'evento. Più log vengono registrati e gestiti nella stessa riga, quindi, ad esempio, se hai 20 log identici, le informazioni vengono archiviate in una riga anziché in 20 righe separate.

Puoi considerare gli eventi di sistema come un termine generico per gli eventi che si verificano a un livello superiore, ma che potrebbero influire sulle tue risorse Compute Engine. Un evento di sistema si verifica quando viene attivato un errore non correlato a un evento pianificato. Gli eventi di sistema vengono registrati a livello di parco risorse.

Utilizzare integrazioni di terze parti

Il monitoraggio offre integrazioni con applicazioni di terze parti. Queste integrazioni ti consentono di raccogliere dati di telemetria da applicazioni come Apache Web Server, Cloud SQL per MySQL, Memorystore per Redis e altre per i deployment in esecuzione su Compute Engine e GKE. Quando utilizzi Compute Engine, la telemetria di terze parti viene raccolta da Ops Agent.

Passaggi successivi