Questo documento descrive come monitorare e cercare di ottimizzare le risorse per un job batch visualizzando le metriche in Cloud Monitoring. Per scoprire di più sulle risorse su cui viene eseguito un job, consulta Risorse del job.
Per qualsiasi job, Monitoring offre metriche di base come utilizzo della CPU e traffico di rete. Tuttavia, alcune metriche, come l'utilizzo della memoria e dei processi, possono essere raccolte solo se un job installa Ops Agent. Le metriche per le risorse di un job consentono di valutare le prestazioni e l'utilizzo di ogni risorsa. Queste informazioni possono aiutarti a identificare miglioramenti per eventuali iterazioni future del job. Ad esempio, potresti rimuovere le risorse non utilizzate per ottimizzare i costi oppure potresti migliorare o aumentare le risorse addestrate per migliorare le prestazioni.
Prima di iniziare
- Se non hai mai utilizzato Batch, consulta Inizia a utilizzare Batch e abilita Batch completando i prerequisiti per progetti e utenti.
- (Facoltativo) Per raccogliere metriche aggiuntive per un job, crea ed esegui un job che installa automaticamente Ops Agent.
- Se non l'hai ancora fatto, abilita l'API Monitoring:
-
Per ottenere le autorizzazioni necessarie per visualizzare le metriche di osservabilità, chiedi all'amministratore di concederti il ruolo IAM Monitoring Metric Viewer (
roles/monitoring.metricViewer
) per il progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Visualizza metriche per risorse job
Osservazione e monitoraggio delle VM nella documentazione di Compute Engine fornisce informazioni concettuali pertinenti sulle metriche delle VM. Tuttavia, sono consigliati metodi diversi per visualizzare le metriche delle VM per i job batch. In particolare, la documentazione di Compute Engine spiega come visualizzare le metriche utilizzando le dashboard di Monitoring predefinite per le pagine di Compute Engine o Compute Engine nella console Google Cloud. Ma, soprattutto, questi metodi non mostrano informazioni sulle VM eliminate. Di conseguenza, non utilizzare questi metodi a meno che tu non voglia solo visualizzare le metriche per i job batch in esecuzione.
Visualizza le metriche per i job batch in esecuzione e terminati utilizzando i grafici Metrics Explorer come spiegato in questa sezione. I grafici sono temporanei, a meno che non li salvi in dashboard personalizzate.
Per creare un grafico per visualizzare una o più metriche:
- (Facoltativo) Se prevedi di salvare il grafico, identifica o crea una dashboard personalizzata per il grafico.
Crea un grafico di Metrics Explorer per una o più metriche.
Senza filtri, ogni metrica VM in un grafico include i dati di tutte le VM del progetto. Facoltativamente, se vuoi filtrare il grafico in modo da includere solo le metriche di tutti i job batch o di job batch specifici, aggiungi il seguente filtro:
group=RESOURCE_GROUP_NAME
Sostituisci
RESOURCE_GROUP_NAME
con il nome di un gruppo di risorse per i job batch. Per ulteriori informazioni, consulta Creare gruppi di risorse per filtrare le metriche in questo documento.
Crea gruppi di risorse per filtrare le metriche
Puoi utilizzare i gruppi di risorse come filtri personalizzabili per i grafici di Metrics Explorer. Per creare un gruppo di risorse per tutti i job batch o per job batch specifici nel tuo progetto, segui questi passaggi:
Seleziona un'etichetta da utilizzare come criterio di appartenenza in base ai job che vuoi includere nel gruppo:
- Tutti i job batch: utilizza
l'etichetta
batch-node
predefinita, che viene applicata automaticamente a tutte le risorse per tutti i job batch e ha un valore nullo. Job batch specifici: utilizza un'etichetta applicata alle risorse solo per job batch specifici.
Ad esempio, se vuoi creare un gruppo basato su nomi di job completi o parziali, utilizza il nome predefinito dell'etichetta
batch-job-id
con un valore specifico. L'etichettabatch-job-id
viene applicata automaticamente a tutte le risorse per tutti i job batch e definita con il nome del job.In alternativa, se utilizzi un'etichetta personalizzata, devi applicarla a tutte le risorse dei job batch che vuoi includere nel gruppo quando crei i job.
- Tutti i job batch: utilizza
l'etichetta
Assicurati che il progetto abbia almeno un job con l'etichetta selezionata e che questo job sia nello stato
RUNNING
. In caso contrario, questa etichetta non verrà visualizzata come opzione quando provi a creare il gruppo di risorse.Crea un gruppo di risorse. Quando specifichi i criteri di appartenenza, segui questi passaggi:
- Imposta il Tipo su Tag.
Imposta il campo Tag sul nome dell'etichetta selezionata. Imposta quindi i campi seguenti in base ai valori delle etichette che vuoi includere nel gruppo.
Ad esempio, se vuoi che questo gruppo includa tutti i job batch, imposta Tag su
batch-node
e imposta Operatore su Exists. In alternativa, vuoi che questo gruppo includa job batch con nomi che iniziano contest
, imposta Tag subatch-job-id
, imposta Operatore su Inizia con e imposta Valore sutest
.
Passaggi successivi
- Scopri di più sulle metriche delle risorse dei job:
- Scopri altri metodi per monitorare e ottimizzare i job batch: