Osserva e monitora le VM


Questo documento descrive come accedere e visualizzare le metriche delle macchine virtuali (VM). it descrive inoltre come rivedere le metriche delle VM per saperne di più sulle VM di risolvere problemi specifici con una VM.

Il monitoraggio delle istanze di macchine virtuali (VM) è essenziale nella gestione delle risorse VM. Compute Engine offre una visione d'insieme Metriche VM che usano la scheda Osservabilità della console Google Cloud. Questo fornisce una dashboard predefinita che utilizza i dati di telemetria in modo da poter monitorare le tue VM e prendi decisioni consapevoli su Compute Engine Google Cloud. Puoi anche personalizzare la dashboard predefinita in modo da visualizzare solo le metriche specifiche che desideri.

Tutte le VM hanno dati di base sull'utilizzo dei processi disponibili al momento della creazione. Tuttavia, l'installazione di Ops Agent fornisce insight più approfonditi sul comportamento delle VM.

Per ulteriori informazioni sulla creazione di un criterio di avviso di Monitoring, utilizza il Metrics Explorer o per informazioni generali su come monitorare lavorare su Google Cloud, consulta i documenti su Cloud Monitoring.

Prima di iniziare

(Facoltativo) Installa Ops Agent per raccogliere dati più dettagliati dalle istanze Compute Engine.

Per verificare in quali istanze VM è installato Ops Agent:

  1. Nella console Google Cloud, vai a Dashboard di Monitoring

    Vai a Dashboard di Monitoring

  2. Seleziona Istanze VM dall'elenco della dashboard.

  3. Fai clic su Elenco per visualizzare le VM sotto forma di elenco.

    Vengono visualizzate tutte le VM nel progetto. La colonna Agent mostra lo stato dell'installazione di Ops Agent. Puoi installare o aggiornare da questa pagina.

  4. (Facoltativo) Per aggiornare la dashboard predefinita in modo che mostri gli eventi, ad esempio quelle che indicano un aggiornamento a un gruppo di istanze gestite, Seleziona Eventi, quindi completa la finestra di dialogo.

    Per ulteriori informazioni sugli eventi, vedi Tipi di evento.

Accedi alle metriche di osservabilità della VM

Accedere alle informazioni per una o più VM tramite l'Osservabilità nella console Google Cloud. Per impostazione predefinita, una dashboard predefinita visualizza metriche delle VM. Se vuoi vedere solo le metriche specifiche che preferisci, puoi creare una dashboard personalizzata.

Visualizza le metriche di osservabilità per una singola VM

Le metriche di base delle VM, come l'utilizzo della CPU e il traffico di rete, sono disponibili quando crei la tua VM. Metriche per l'utilizzo della memoria e dei processi sono disponibili solo con l'installazione di Ops Agent, che è l'agente per la raccolta dei dati di telemetria dalle istanze Compute Engine.

Per visualizzare le metriche per una singola VM:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Seleziona una VM per aprire la pagina Dettagli.

  3. Fai clic sulla scheda Osservabilità per visualizzare le informazioni sulla VM.

  4. (Facoltativo) Reimposta il periodo di tempo predefinito di un'ora sul periodo che preferisci. da monitorare.

  5. (Facoltativo) Per aggiornare la dashboard predefinita in modo che mostri gli eventi, ad esempio quelle che indicano un aggiornamento a un gruppo di istanze gestite, Seleziona Eventi, quindi completa la finestra di dialogo.

    Per ulteriori informazioni sugli eventi, vedi Tipi di evento.

Le informazioni nella Figura 1 mostrano i dettagli della VM senza Ops Agent sulla VM. Nota che i valori di Memoria e Utilizzo dello spazio su disco grafici non contengono dati.

Scheda Osservabilità
 per una VM senza Ops Agent installato.
Figura 1: la scheda Osservabilità per una singola VM senza installare Ops Agent.

Visualizza le metriche di osservabilità per più VM

L'osservabilità a livello di parco risorse mostra le metriche per i primi cinque VM con il massimo utilizzo di processi. Le prime cinque VM elencate variano per o una metrica di valutazione. Potresti non vedere le stesse cinque VM per ogni processo. Sebbene esistano più dati disponibili a livello di parco risorse senza installare rispetto alla quantità di dati disponibili per una singola VM, durante l'installazione l'agente fornisce più dati per la risoluzione di eventuali problemi futuri.

Per visualizzare le metriche per più VM:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Fai clic sulla scheda Osservabilità.

  3. (Facoltativo) Reimposta il periodo di tempo predefinito di un'ora sul periodo che preferisci. da monitorare.

  4. Filtra i risultati in base a una o più delle seguenti opzioni:

    • ID
    • Nome
    • Tipo di macchina
    • Zona
    • Regione
    • Gruppo di istanze
    • Etichette
    • Stato

Le informazioni nella Figura 2 mostrano un esempio della scheda Osservabilità quando su più VM in un progetto è installato Ops Agent. Nota che ci sono altre disponibili per queste VM.

Più VM
 su cui è installato Ops Agent.
Figura 2: più istanze VM con Ops Agent installato.

Visualizza metriche dettagliate per una VM

Ogni metrica di processo VM è rappresentata da una linea su un grafico. Nella Nell'esempio seguente, sulla VM uptime-demo è installato Ops Agent. Memoria sull'utilizzo dei dati per la risoluzione dei problemi. Se una VM non è elencati nella scheda, filtra in base al nome della VM per trovare una VM specifica.

Per recuperare le informazioni su questa o un'altra delle prime cinque VM da nella scheda Osservabilità:

  1. Tieni il puntatore sulla linea del grafico di qualsiasi VM. Viene visualizzata una scheda con un elenco delle prime cinque VM che utilizzano il processo, ciascuna mostra una metrica.
  2. Per saperne di più sul comportamento della VM, fai clic sulla linea del grafico della VM o su un il nome della VM nell'elenco.

La VM uptime-demo mostrata nella scheda nella Figura 3 mostra alcune metriche che potrebbero richiedere una revisione.

La linea del grafico
 rappresenta una VM. Fai clic sul pulsante per scoprire di più su una VM specifica.
Figura 3: la linea del grafico rappresenta una VM. Fai clic per scopri di più su una VM specifica.

Fai clic sulla VM uptime-demo per aprire la pagina Dettagli VM visualizzata in Figura 4, che fornisce le seguenti informazioni:

  • Lo stato di Ops Agent.
  • Le opzioni contestuali per creare Avvisi, ad esempio Eventi, o creare controlli di uptime.
  • L'opzione per visualizzare i dettagli delle configurazioni, delle metriche e dei log della VM.
di Gemini Advanced.
La VM
 La pagina dei dettagli fornisce informazioni su una VM specifica.
Figura 4: la pagina Dettagli VM fornisce informazioni su una VM specifica.

Crea una dashboard personalizzata per visualizzare metriche specifiche

Per impostazione predefinita, la scheda Osservabilità in Compute Engine fornisce una dashboard che mostra le metriche di base delle VM. Per visualizzare solo le metriche specifiche che che desideri visualizzare, puoi modificare la dashboard predefinita e salvarla come Fitbit.com. Puoi personalizzare la dashboard come preferisci.

Per creare una dashboard personalizzata:

  1. Nella console Google Cloud, vai alla pagina Istanze VM.

    Vai a Istanze VM

  2. Vai alla scheda Osservabilità come segue:

    • Per una singola VM: nella pagina Istanze VM, fai clic sul nome della VM per aprire la relativa pagina Dettagli, quindi fai clic sulla scheda Osservabilità per quella VM.
    • Per più VM: nella pagina Istanze VM, fai clic su Osservabilità .
  3. Se il menu a discesa Dashboard è abilitato, le dashboard personalizzate vengono disponibili. Per modificare una visualizzazione personalizzata, selezionane una dall'elenco a discesa, e poi, nella barra degli strumenti della dashboard, fai clic su .

  4. Altrimenti, per personalizzare la dashboard predefinita, nella barra degli strumenti della dashboard fai clic su .

    Compute Engine crea una copia della dashboard predefinita, quindi apre il testo in modalità di modifica.

  5. Nell'editor puoi aggiungere, modificare, eliminare, riposizionare o ridimensionare visualizzazioni nella dashboard. Le visualizzazioni sono chiamate collettivamente widget. Per ulteriori informazioni sulle diverse tipi di widget, consulta la panoramica delle dashboard.

    • Per aggiungere un widget, fai clic su Aggiungi widget nella barra degli strumenti della dashboard e per completare la configurazione.

      Ad esempio, per visualizzare i log con i dati delle metriche, fai clic su Aggiungi widget. Seleziona Log e fai clic su Applica.

    • Per modificare un widget, posiziona il puntatore sul widget attiva la barra degli strumenti, fai clic Modifica widget, quindi utilizza Finestra di dialogo Configura widget. Per applicare le modifiche alla dashboard: Nella barra degli strumenti, fai clic su Applica. Per ignorare le modifiche, fai clic su Annulla.

    • Per eliminare un widget, posiziona il puntatore sul widget per attivare la relativa barra degli strumenti, fai clic Altre opzioni di grafico, e seleziona Elimina.

    • Per riposizionare un widget, utilizza il puntatore per trascinarlo per la relativa intestazione. in una nuova posizione.

    • Per ridimensionare un widget, utilizza il puntatore per riposizionare l'angolo a destra del widget.

  6. Dopo aver modificato la dashboard, fai clic su Salva.

  7. Nella finestra di dialogo che conferma le modifiche, fai clic su Visualizza dashboard personalizzata. per passare alla vista personalizzata.

    Puoi tornare alla visualizzazione predefinita selezionando Predefinito dalla nel menu a discesa Dashboard.

Rivedi le metriche delle risorse

Per scoprire di più su ciascuna metrica delle risorse, fai clic su ciascun processo all'interno della Menu della scheda Osservabilità:

  • Esplora CPU, Processi, Utilizzo della Memoria, Rete e l'utilizzo di Disk.
  • Visualizza i dati dei log cercando Log per identificare e visualizzare Eventi di sistema.
  • Aggiungi Integrazioni di terze parti e cerca Configurato esistente integrazioni.

Il resto di questa sezione descrive esempi di come alcuni processi sui carichi di lavoro. Queste informazioni presuppongono che Ops Agent sia installato sulle tue VM.

Utilizzo CPU

Un esempio di utilizzo estremo della CPU potrebbe essere quando un server si trova in una carico inaspettatamente intenso, ad esempio quando su un sito web si verifica un picco improvviso nel traffico o quando è in corso un'attività di elaborazione dati su larga scala. In tale situazioni in cui la CPU potrebbe essere in esecuzione al 100% della capacità per un periodo prolungato causando un rallentamento o l'interruzione della risposta del server.

In questo esempio, il problema è la saturazione. Se l'utilizzo della CPU è al 100%, che potrebbero andare bene per i tuoi carichi di lavoro, ma potresti voler esaminare altre metriche per capire se è necessario un intervento. In questo caso, potresti voler un criterio di avviso per ricevere una notifica quando viene Picchi di utilizzo della CPU.

Con le autorizzazioni appropriate, puoi connetterti tramite SSH alle tue VM per indagare risolvere il problema. Tuttavia, se Ops Agent è installato, puoi vedere maggiori dettagli dati storici per aiutarti a risolvere il problema.

Utilizzo dei processi

Un esempio di comportamento estremo potrebbe essere quando un processo consuma quantità eccessiva di risorse come CPU, memoria o I/O del disco, fino al punto causa un peggioramento delle prestazioni o persino l'arresto anomalo della VM.

Ad esempio, se un processo in esecuzione su una VM si verifica una perdita di memoria, potrebbe iniziare a consumare quantità sempre più grandi di memoria nel tempo, causando l'esaurimento della memoria e l'arresto anomalo della VM. Analogamente, se un processo utilizza in modo intensivo il disco, può causare il malfunzionamento si saturano, il che porta a tempi di risposta lenti per gli altri processi.

Utilizzo memoria

I database richiedono una grande quantità di memoria per eseguire operazioni come l'indicizzazione, ordinare e unire le tabelle.

Un esempio di utilizzo elevato della memoria su una VM è quando si esegue un server di database, come Cloud SQL per MySQL o Cloud SQL per PostgreSQL, con un set di dati di grandi dimensioni. Se la memoria disponibile della VM è troppo piccola, ricarica un set di dati la memoria può provocare un'esecuzione lenta o un arresto anomalo del database.

Rendimento della rete

I problemi di prestazioni della rete sono il risultato di diversi fattori: congestione, limitazioni della larghezza di banda, problemi hardware o software e latenza. Per diagnosticare il problema, monitorare le metriche delle prestazioni di rete, risolvere i problemi e software e analizzare i modelli di traffico di rete per identificare risolvere la causa principale del problema.

Utilizzo del disco

L'utilizzo elevato del disco su una VM si verifica quando c'è una grande quantità di dati vengono letti o scritti dal disco virtuale con un conseguente ritardo nell'accesso al disco e un possibile effetto sulle prestazioni delle VM.

Monitoraggio delle metriche di utilizzo del disco, come le operazioni di I/O del disco per secondi (IOPS), lunghezza della coda del disco e tempo medio di risposta del disco possono essere utili identificare e diagnosticare i problemi di utilizzo elevato del disco su una VM.

Controlla log ed eventi di sistema

La pagina Tutti i log fornisce i dati di log relativi alle risorse. Ordina per per identificare i problemi e ispezionare il payload.

Gli audit log registrano gli eventi amministrativi che si verificano in le tue risorse. I log possono indicare cosa è successo per attivare l'evento. Più log vengono registrati e gestiti nella stessa riga, ad esempio: se hai 20 log identici, le informazioni vengono archiviate in una singola riga, più di 20 righe separate.

Puoi considerare gli eventi di sistema come una termine generico per gli eventi che si verificano a un livello superiore, ma che potrebbero influire le tue risorse Compute Engine. Un evento di sistema si verifica quando un errore non correlato a un evento pianificato. Gli eventi di sistema vengono registrati a livello di parco risorse.

Utilizzare integrazioni di terze parti

Monitoring fornisce integrazioni con applicazioni di terze parti. Queste integrazioni ti consentono di raccogliere dati di telemetria da applicazioni come Apache Server web, Cloud SQL per MySQL, Memorystore for Redis e altri per di deployment in esecuzione su Compute Engine e GKE. Quando usano Compute Engine, la telemetria di terze parti viene raccolta da Ops Agent.

Passaggi successivi