Monitora e ottimizza le risorse del job visualizzando le metriche

Questo documento descrive come monitorare e cercare di ottimizzare le risorse per un job batch visualizzando le metriche in Cloud Monitoring. Per scoprire di più sulle risorse su cui viene eseguito un job, consulta Risorse del job.

Per qualsiasi job, Monitoring offre metriche di base come utilizzo della CPU e traffico di rete. Tuttavia, alcune metriche, come l'utilizzo della memoria e dei processi, possono essere raccolte solo se un job installa Ops Agent. Le metriche per le risorse di un job consentono di valutare le prestazioni e l'utilizzo di ogni risorsa. Queste informazioni possono aiutarti a identificare miglioramenti per eventuali iterazioni future del job. Ad esempio, potresti rimuovere le risorse non utilizzate per ottimizzare i costi oppure potresti migliorare o aumentare le risorse addestrate per migliorare le prestazioni.

Prima di iniziare

Visualizza metriche per risorse job

Osservazione e monitoraggio delle VM nella documentazione di Compute Engine fornisce informazioni concettuali pertinenti sulle metriche delle VM. Tuttavia, sono consigliati metodi diversi per visualizzare le metriche delle VM per i job batch. In particolare, la documentazione di Compute Engine spiega come visualizzare le metriche utilizzando le dashboard di Monitoring predefinite per le pagine di Compute Engine o Compute Engine nella console Google Cloud. Ma, soprattutto, questi metodi non mostrano informazioni sulle VM eliminate. Di conseguenza, non utilizzare questi metodi a meno che tu non voglia solo visualizzare le metriche per i job batch in esecuzione.

Visualizza le metriche per i job batch in esecuzione e terminati utilizzando i grafici Metrics Explorer come spiegato in questa sezione. I grafici sono temporanei, a meno che non li salvi in dashboard personalizzate.

Per creare un grafico per visualizzare una o più metriche:

  1. (Facoltativo) Se prevedi di salvare il grafico, identifica o crea una dashboard personalizzata per il grafico.
  2. Crea un grafico di Metrics Explorer per una o più metriche.

    Senza filtri, ogni metrica VM in un grafico include i dati di tutte le VM del progetto. Facoltativamente, se vuoi filtrare il grafico in modo da includere solo le metriche di tutti i job batch o di job batch specifici, aggiungi il seguente filtro:

    group=RESOURCE_GROUP_NAME
    

    Sostituisci RESOURCE_GROUP_NAME con il nome di un gruppo di risorse per i job batch. Per ulteriori informazioni, consulta Creare gruppi di risorse per filtrare le metriche in questo documento.

Crea gruppi di risorse per filtrare le metriche

Puoi utilizzare i gruppi di risorse come filtri personalizzabili per i grafici di Metrics Explorer. Per creare un gruppo di risorse per tutti i job batch o per job batch specifici nel tuo progetto, segui questi passaggi:

  1. Seleziona un'etichetta da utilizzare come criterio di appartenenza in base ai job che vuoi includere nel gruppo:

    • Tutti i job batch: utilizza l'etichetta batch-node predefinita, che viene applicata automaticamente a tutte le risorse per tutti i job batch e ha un valore nullo.
    • Job batch specifici: utilizza un'etichetta applicata alle risorse solo per job batch specifici.

      Ad esempio, se vuoi creare un gruppo basato su nomi di job completi o parziali, utilizza il nome predefinito dell'etichetta batch-job-id con un valore specifico. L'etichetta batch-job-id viene applicata automaticamente a tutte le risorse per tutti i job batch e definita con il nome del job.

      In alternativa, se utilizzi un'etichetta personalizzata, devi applicarla a tutte le risorse dei job batch che vuoi includere nel gruppo quando crei i job.

  2. Assicurati che il progetto abbia almeno un job con l'etichetta selezionata e che questo job sia nello stato RUNNING. In caso contrario, questa etichetta non verrà visualizzata come opzione quando provi a creare il gruppo di risorse.

  3. Crea un gruppo di risorse. Quando specifichi i criteri di appartenenza, segui questi passaggi:

    1. Imposta il Tipo su Tag.
    2. Imposta il campo Tag sul nome dell'etichetta selezionata. Imposta quindi i campi seguenti in base ai valori delle etichette che vuoi includere nel gruppo.

      Ad esempio, se vuoi che questo gruppo includa tutti i job batch, imposta Tag su batch-node e imposta Operatore su Exists. In alternativa, vuoi che questo gruppo includa job batch con nomi che iniziano con test, imposta Tag su batch-job-id, imposta Operatore su Inizia con e imposta Valore su test.

Passaggi successivi