Questo documento descrive come monitorare e provare a ottimizzare le risorse per un job batch visualizzando le metriche in Cloud Monitoring. Per scoprire di più sulle risorse su cui viene eseguito un job, consulta Risorse dei job.
Per qualsiasi job, il monitoraggio fornisce metriche di base come l'utilizzo della CPU e il traffico di rete. Tuttavia, alcune metriche, come l'utilizzo della memoria e dei processi, possono essere raccolte solo se un job installa Ops Agent. Le metriche relative alle risorse di un job ti aiutano a valutare il rendimento e l'utilizzo di ciascuna risorsa. Queste informazioni possono aiutarti a identificare i miglioramenti per eventuali future iterazioni del job. Ad esempio, puoi rimuovere le risorse inutilizzate per contribuire a ottimizzare i costi oppure migliorare o aumentare le risorse sottoposte a stress per contribuire a migliorare il rendimento.
Prima di iniziare
- Se non hai mai utilizzato Batch, consulta la guida introduttiva all'utilizzo di Batch e attivalo completando i prerequisiti per progetti e utenti.
- (Facoltativo) Per raccogliere metriche aggiuntive per un job, crea ed esegui un job che installa automaticamente Ops Agent.
- Se non l'hai già fatto, abilita l'API Monitoring per il tuo progetto:
-
Per ottenere le autorizzazioni necessarie per visualizzare le metriche di osservabilità, chiedi all'amministratore di concederti il ruolo IAM Visualizzatore metriche di monitoraggio (
roles/monitoring.metricViewer
) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Visualizzare le metriche per le risorse dei job
La sezione Osserva e monitora le VM della documentazione di Compute Engine fornisce informazioni concettuali pertinenti sulle metriche delle VM. Tuttavia, per visualizzare le metriche delle VM per i job batch sono consigliati metodi diversi. Nello specifico, la documentazione di Compute Engine spiega come visualizzare le metriche utilizzando le dashboard di monitoraggio predefinite per Compute Engine o le pagine di Compute Engine nella console Google Cloud. Tuttavia, è importante sottolineare che questi metodi non mostrano informazioni sulle VM che sono state eliminate. Di conseguenza, non utilizzare questi metodi a meno che tu non voglia visualizzare solo le metriche per i job batch durante l'esecuzione.
Visualizza le metriche per i job batch in esecuzione e completati utilizzando i grafici di Metrics Explorer come spiegato in questa sezione. In particolare, i grafici sono temporanei, a meno che non li salvi nelle dashboard personalizzate.
Per creare un grafico per visualizzare una o più metriche:
- (Facoltativo) Se prevedi di salvare il grafico, identifica o crea una dashboard personalizzata per il grafico.
Crea un grafico di Metrics Explorer per una o più metriche.
Senza filtri, ogni metrica VM in un grafico include i dati di tutte le VM nel tuo progetto. Se vuoi filtrare il grafico in modo da includere solo le metriche di tutti o di job batch specifici, aggiungi il seguente filtro:
group=RESOURCE_GROUP_NAME
Sostituisci
RESOURCE_GROUP_NAME
con il nome di un gruppo di risorse per i job batch. Per ulteriori informazioni, consulta Creare gruppi di risorse per filtrare le metriche in questo documento.
Creare gruppi di risorse per filtrare le metriche
Puoi utilizzare i gruppi di risorse come filtri personalizzabili per i grafici di Metrics Explorer. Per creare un gruppo di risorse per tutti o per job batch specifici nel tuo progetto:
Seleziona un'etichetta da utilizzare come criteri di appartenenza in base ai job da includere nel gruppo:
- Tutti i job batch: utilizza l'etichetta
batch-node
predefinita, che viene applicata automaticamente a tutte le risorse per tutti i job batch e ha un valore nullo. Job batch specifici:utilizza un'etichetta applicata alle risorse solo per job batch specifici.
Ad esempio, se vuoi creare un gruppo in base ai nomi di job completi o parziali, utilizza il nome dell'etichetta
batch-job-id
predefinito con un valore specifico. L'etichettabatch-job-id
viene applicata automaticamente a tutte le risorse per tutti i job batch e definita con il nome del job.In alternativa, se utilizzi un'etichetta personalizzata, devi applicarla a tutte le risorse dei job batch che vuoi includere nel gruppo quando li crei.
- Tutti i job batch: utilizza l'etichetta
Assicurati che il progetto abbia almeno un job con l'etichetta selezionata e che questo job sia nello stato
RUNNING
. In caso contrario, questa etichetta non verrà visualizzata come opzione quando provi a creare il gruppo di risorse.Crea un gruppo di risorse. Quando specifichi i criteri di appartenenza, svolgi i seguenti passaggi:
- Imposta Tipo su Tag.
Imposta il campo Tag sul nome dell'etichetta selezionata. Poi imposta i seguenti campi in base ai valori delle etichette che vuoi includere nel gruppo.
Ad esempio, se vuoi che questo gruppo includa tutti i job in batch, imposta Tag su
batch-node
e Operatore su Esiste. In alternativa, se vuoi che questo gruppo includa i job batch con nomi che iniziano contest
, imposta Tag subatch-job-id
, Operatore su Inizia con e Valore sutest
.
Passaggi successivi
- Scopri di più sulle metriche delle risorse dei job:
- Scopri altri metodi per monitorare e ottimizzare i job di Batch: