Questo documento descrive come monitorare e provare a ottimizzare le risorse per un job batch visualizzando le metriche in Cloud Monitoring. Per scoprire di più sulle risorse su cui viene eseguito un job, consulta Risorse dei job.
Per qualsiasi job, Monitoring offre metriche di base come l'utilizzo e il traffico di rete. Tuttavia, alcune metriche, come l'utilizzo della memoria e dei processi, possono essere raccolte solo se un job installa Ops Agent. Le metriche relative alle risorse di un job ti aiutano a valutare il rendimento e l'utilizzo di ciascuna risorsa. Queste informazioni possono aiutarti a identificare miglioramenti per qualsiasi future iterazioni del job. Ad esempio, puoi rimuovere le risorse non utilizzate per ottimizzare i costi oppure potresti migliorare o aumentare le risorse per migliorare le prestazioni.
Prima di iniziare
- Se non hai mai utilizzato Batch, rivedi Inizia a utilizzare Batch e abilita Batch, completando prerequisiti per progetti e utenti.
- (Facoltativo) Per raccogliere metriche aggiuntive per un job, crea ed esegui un job che installa automaticamente Ops Agent.
- Se non l'hai ancora fatto, abilita l'API Monitoring:
-
Per ottenere le autorizzazioni necessarie per visualizzare le metriche di osservabilità, chiedi all'amministratore di concederti Ruolo IAM Monitoring Metric Viewer (
roles/monitoring.metricViewer
) per il progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Visualizza metriche per risorse job
La sezione Osserva e monitora le VM della documentazione di Compute Engine fornisce informazioni concettuali pertinenti sulle metriche delle VM. Tuttavia, per visualizzare le metriche delle VM per i job batch sono consigliati metodi diversi. In particolare, La documentazione di Compute Engine spiega come visualizzare le metriche utilizzando le dashboard di Monitoring predefinite per Compute Engine pagine di Compute Engine nella console Google Cloud. Tuttavia, è importante sottolineare che questi metodi non mostrano informazioni sulle VM che sono state eliminate. Di conseguenza, non utilizzare questi metodi a meno che tu non voglia visualizzare solo le metriche per i job batch durante l'esecuzione.
Visualizza le metriche per l'esecuzione e il completamento di job batch in base a usando i grafici di Metrics Explorer, come spiegato in questa sezione. In particolare, i grafici sono temporanei, a meno che non salvi a dashboard personalizzate.
Per creare un grafico per visualizzare una o più metriche:
- (Facoltativo) Se prevedi di salvare il grafico, identifica o crea una dashboard personalizzata per il grafico.
Crea un grafico di Metrics Explorer per una o più metriche.
Senza filtri, ogni metrica VM in un grafico include i dati di tutte le VM in del tuo progetto. Se vuoi filtrare il grafico in modo da includere solo le metriche di tutti o di job batch specifici, aggiungi il seguente filtro:
group=RESOURCE_GROUP_NAME
Sostituisci
RESOURCE_GROUP_NAME
con il nome di un gruppo di risorse per i job batch. Per ulteriori informazioni, consulta Creare gruppi di risorse per filtrare le metriche in questo documento.
Crea gruppi di risorse per filtrare le metriche
Puoi utilizzare i gruppi di risorse come filtri personalizzabili per i grafici di Metrics Explorer. Per creare un gruppo di risorse per tutti o per job batch specifici nel tuo progetto:
Seleziona un'etichetta da utilizzare come criteri di appartenenza in base ai job che desideri includere gruppo:
- Tutti i job batch: utilizza l'etichetta
batch-node
predefinita, che viene applicata automaticamente a tutte le risorse per tutti i job batch e ha un valore nullo. Job batch specifici: utilizza un'etichetta applicata alle risorse solo per job batch specifici.
Ad esempio, se vuoi creare un gruppo basato su un job completo o parziale utilizza il nome predefinito dell'etichetta
batch-job-id
con un valore specifico. L'etichettabatch-job-id
viene applicata automaticamente a tutte le risorse per tutti i job batch e definita con il nome del job.In alternativa, se utilizzi un'etichetta personalizzata, devi applicarla a tutte le risorse dei job batch che vuoi includere nel gruppo quando li crei.
- Tutti i job batch: utilizza l'etichetta
Assicurati che il progetto abbia almeno un job con l'etichetta selezionata che questo job sia nello stato
RUNNING
. In caso contrario, questa etichetta non verrà visualizzata come opzione quando provi a creare il gruppo di risorse.Crea un gruppo di risorse. Quando specifichi i criteri di appartenenza, svolgi i seguenti passaggi:
- Imposta Tipo su Tag.
Imposta il campo Tag sul nome dell'etichetta selezionata. Poi imposta i seguenti campi in base ai valori delle etichette che vuoi includere nel gruppo.
Ad esempio, se vuoi che questo gruppo includa tutti i job in batch, imposta Tag su
batch-node
e Operatore su Esiste. In alternativa, se vuoi che questo gruppo includa i job batch con nomi che iniziano contest
, imposta Tag subatch-job-id
, Operatore su Inizia con e Valore sutest
.
Passaggi successivi
- Scopri di più sulle metriche delle risorse dei job:
- Scopri altri metodi per monitorare e ottimizzare i job batch: