Questo documento descrive come configurare Google Kubernetes Engine (GKE) per inviare le metriche di Google Cloud a Cloud Monitoring. Le metriche in Cloud Monitoring possono compilare dashboard personalizzate, generare avvisi, creare obiettivi di livello di servizio o essere recuperate da servizi di monitoraggio di terze parti utilizzando l'API Cloud Monitoring.
GKE fornisce diverse origini di metriche:
- Metriche di sistema: metriche dei componenti di sistema essenziali che descrivono risorse di basso livello come CPU, memoria e spazio di archiviazione.
- Google Cloud Managed Service per Prometheus: consente di monitorare e creare avvisi sui carichi di lavoro utilizzando Prometheus, senza gestire e utilizzare Prometheus manualmente su larga scala.
Pacchetti di metriche di osservabilità:
- Metriche del piano di controllo: metriche esportate da alcuni componenti del piano di controllo, come il server API e lo scheduler.
Metriche di stato Kube: un insieme selezionato di metriche esportate dal servizio kube state, utilizzato per monitorare lo stato degli oggetti Kubernetes come pod, deployment e altro ancora. Per l'insieme delle metriche incluse, consulta Utilizza le metriche di stato kube.
Il pacchetto dello stato di kube è una soluzione gestita. Se hai bisogno maggiore flessibilità, ad esempio se devi raccogliere ulteriori metriche o la necessità di gestire intervalli di scrape o di eseguire lo scraping di risorse: puoi disabilitare il pacchetto, se abilitato, ed eseguire il deployment della tua istanza dell'open source servizio di metriche di stato kube. Per maggiori informazioni, consulta la documentazione dell'esportatore di Google Cloud Managed Service per Prometheus per le metriche di stato Kube.
cAdvisor/Kubelet: un un insieme selezionato di metriche di cAdvisor e Kubelet. Per l'insieme di metriche incluse, consulta Utilizzare le metriche cAdvisor/Kubelet.
Il pacchetto cAdvisor/Kubelet è una soluzione gestita. Se hai bisogno di una maggiore flessibilità, ad esempio se devi raccogliere altre metriche, gestire gli intervalli di scansione o eseguire lo scraping di altre risorse, puoi disattivare il pacchetto, se è abilitato, ed eseguire il deployment della tua istanza dei servizi di metriche cAdvisor/Kubelet open source.
Metriche di NVIDIA Data Center GPU Manager (DCGM): le metriche di DCGM che forniscono una visione completa dello stato, delle prestazioni e dell'utilizzo delle GPU.
Metriche di sistema
Quando viene creato un cluster, GKE raccoglie per impostazione predefinita metriche emesse dai componenti del sistema.
Puoi scegliere se inviare o meno le metriche dal tuo cluster GKE a Cloud Monitoring. Se scegli di inviare le metriche a Cloud Monitoring, devi inviare le metriche di sistema.
Tutte le metriche di sistema di GKE vengono importate in Cloud Monitoring con
il prefisso kubernetes.io
.
Prezzi
Cloud Monitoring non addebita alcun costo per l'importazione delle metriche di sistema di GKE. Per maggiori informazioni, consulta Prezzi di Cloud Monitoring.
Configurazione della raccolta delle metriche di sistema
Per attivare la raccolta delle metriche di sistema, passa il valore SYSTEM
alla
--monitoring
del gruppo
gcloud container clusters create
o
gcloud container clusters update
tramite comandi SQL.
Per disattivare la raccolta delle metriche di sistema, utilizza il valore NONE
per il flag --monitoring
. Se la raccolta delle metriche di sistema è disattivata, informazioni di base come utilizzo della CPU,
l'utilizzo della memoria e l'utilizzo del disco non sono disponibili per un cluster durante la visualizzazione
metriche di osservabilità.
Per i cluster GKE Autopilot, non puoi disattivare la raccolta delle metriche di sistema.
Per ulteriori dettagli sull'integrazione di Cloud Monitoring con GKE, consulta Osservabilità per GKE.
Per configurare la raccolta di metriche di sistema con Terraform,
vedi il blocco monitoring_config
nella
Registro Terraform per google_container_cluster
.
Per informazioni generali sull'utilizzo di Google Cloud con Terraform, consulta
Terraform con Google Cloud.
Elenco delle metriche di sistema
Le metriche di sistema includono le metriche dei componenti di sistema essenziali importanti per Kubernetes. Per un elenco di queste metriche, consulta Metriche di sistema di GKE.
Se attivi Cloud Monitoring per il tuo cluster, non puoi disattivare il monitoraggio del sistema (--monitoring=SYSTEM
).
Metriche abilitate per impostazione predefinita in GKE Enterprise
Nelle seguenti tabelle è presente un segno di spunta () indica quali metriche sono abilitate per impostazione predefinita quando crei e registra un nuovo cluster in un progetto con GKE Enterprise abilitato:
Nome metrica | Autopilot | Standard |
---|---|---|
Sistema | ||
Server API | ||
Scheduler | ||
Gestore del controller | ||
Volume permanente (archiviazione) | ||
Pod | ||
Deployment | ||
StatefulState | ||
DaemonSet | ||
HorizonalPodAutoscaler | ||
cAdvisor | ||
Kubelet | ||
Metriche NVIDIA Data Center GPU Manager (DCGM) |
Tutti i cluster registrati in un progetto con GKE Enterprise possono utilizzare i pacchetti metriche del piano di controllo, metriche dello stato kube e Metriche cAdvisor/kubelet senza costi aggiuntivi. In caso contrario, queste metriche vengono Cloud Monitoring addebita i costi.
Risolvere i problemi relativi alle metriche di sistema
Se le metriche di sistema non sono disponibili in Cloud Monitoring come previsto, consulta Risolvere i problemi relativi alle metriche di sistema.
Pacchetto: Metriche del piano di controllo
Puoi configurare un cluster GKE per inviare determinate metriche emesse dal server API, dallo scheduler e dal gestore del controller Kubernetes per e configurazione in Cloud Monitoring.
Per ulteriori informazioni, vedi Raccogli e visualizza le metriche del piano di controllo.
Pacchetto: Kube State Metrics
Puoi configurare un cluster GKE in modo da inviare a Cloud Monitoring un insieme selezionato di metriche di stato kube in formato Prometheus. Questo pacchetto di metriche di stato kube include metriche per pod, Deployment, StatefulSet, DaemonSet, risorse HorizontalPodAutoscaler volumi permanenti e attestazioni di volumi permanenti.
Per ulteriori informazioni, vedi Raccogliere e visualizzare le metriche dello stato Kube.
Pacchetto: metriche cAdvisor/Kubelet
Puoi configurare un cluster GKE in modo da inviare un insieme selezionato di metriche cAdvisor/Kubelet in formato Prometheus a Cloud Monitoring. L'insieme selezionato di metriche è un sottoinsieme un ampio set di metriche cAdvisor/Kubelet integrate in ogni il deployment Kubernetes per impostazione predefinita. cAdvisor/Kubelet selezionato è progettato per fornire le metriche più utili, riducendo il volume di importazione e i costi associati.
Per ulteriori informazioni, consulta Raccogliere e visualizzare le metriche cAdvisor/Kubelet.
Pacchetto: metriche di NVIDIA Data Center GPU Manager (DCGM)
Puoi monitorare l'utilizzo, le prestazioni e lo stato delle GPU configurando GKE in modo da inviare le metriche di NVIDIA Data Center GPU Manager (DCGM) a Cloud Monitoring.
Per ulteriori informazioni, vedi Raccogli e visualizza le metriche di NVIDIA Data Center GPU Manager (DCGM).
Disabilita pacchetti di metriche
Puoi disattivare l'utilizzo dei pacchetti di metriche nel cluster. Ti consigliamo di disabilitare determinati pacchetti per ridurre i costi o se utilizzi un meccanismo alternativo per raccogliere le metriche, come Google Cloud Managed Service per Prometheus e un esportatore.
Console
Per disattivare la raccolta delle metriche dalla scheda Dettagli per il cluster:
-
Nella console Google Cloud, vai alla pagina Cluster Kubernetes:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Kubernetes Engine.
Fai clic sul nome del cluster.
Nella riga Funzionalità etichettata Monitoraggio cloud, fai clic sull'icona Modifica.
Nel menu a discesa Componenti, cancella il dei componenti delle metriche da disattivare.
Fai clic su OK.
Fai clic su Salva modifiche.
gcloud
Apri una finestra del terminale con Google Cloud SDK e Google Cloud CLI installato. Un modo per farlo è utilizzare Cloud Shell.
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
Chiama il
gcloud container clusters update
e passare un insieme aggiornato di valori all'elemento--monitoring
flag. L'insieme di valori specificati per il flag--monitoring
sostituisce qualsiasi impostazione precedente.Ad esempio, per disattivare la raccolta di tutte le metriche tranne quelle di sistema, esegui il seguente comando:
gcloud container clusters update CLUSTER_NAME \ --location=COMPUTE_LOCATION \
--enable-managed-prometheus
\ --monitoring=SYSTEMQuesto comando disabilita la raccolta dei dati precedentemente configurati pacchetti di metriche.
Terraform
Per configurare la raccolta di metriche con Terraform,
vedi il blocco monitoring_config
nella
Registro Terraform per google_container_cluster
.
Per informazioni generali sull'utilizzo di Google Cloud con Terraform, consulta
Terraform con Google Cloud.
Informazioni sulla fattura di Monitoring
Puoi usare Cloud Monitoring per identificare il piano di controllo Metriche di stato kube che scrivono il maggior numero di campioni. Queste metriche contribuiscono maggiormente ai tuoi costi. Dopo aver identificato le metriche più costose, puoi modificare le tue configurazioni di scrape per filtrare queste metriche in modo appropriato.
La pagina Gestione delle metriche di Cloud Monitoring fornisce informazioni che può aiutarti a controllare l'importo speso per le metriche fatturabili senza influire sull'osservabilità. La pagina Gestione delle metriche riporta le seguenti informazioni:
- Volumi di importazione per la fatturazione basata sia su byte che su campioni, nelle varie metriche domini e per singole metriche.
- Dati su etichette e cardinalità delle metriche.
- Numero di letture per ogni metrica.
- Utilizzo delle metriche nei criteri di avviso e nelle dashboard personalizzate.
- Tasso di errori di scrittura delle metriche.
Puoi anche utilizzare la gestione delle metriche per: escludere le metriche non necessarie, eliminando il costo dell'importazione.
Per visualizzare la pagina Gestione delle metriche:
-
Nella console Google Cloud, vai alla pagina
Gestione delle metriche:Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
- Seleziona la finestra temporale nella barra degli strumenti. Per impostazione predefinita, la pagina Gestione delle metriche mostra informazioni sulle metriche raccolte nell'ultimo giorno.
Per saperne di più sulla pagina Gestione delle metriche, consulta Visualizza e gestisci l'utilizzo delle metriche.
per identificare quali metriche del piano di controllo o dello stato kube hanno di campioni da importare, segui questi passaggi:
-
Nella console Google Cloud, vai alla
Pagina Gestione delle metriche:Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
Nella scheda prospetto Campioni fatturabili importati, fai clic su Visualizza grafici.
Individua il grafico Importazione del volume dello spazio dei nomi e fai clic su. more_vert Altre opzioni del grafico.
Nel campo Metrica, verifica che siano selezionate la risorsa e la metrica seguenti:
Metric Ingestion Attribution
eSamples written by attribution id
.Nella pagina Filtri:
Nel campo Etichetta, verifica che il valore sia
attribution_dimension
.Nel campo Confronto, verifica che il valore sia
= (equals)
.Nel campo Valore, seleziona
cluster
.
Deseleziona l'impostazione Raggruppa per.
Facoltativamente, filtra solo in base a determinate metriche. Ad esempio, API del piano di controllo le metriche server includono tutte "apiserver" come parte del nome della metrica Le metriche dei pod dello stato kube includono tutte "kube_pod" nell'ambito della nome della metrica, in modo da poter filtrare le metriche contenenti quelle stringhe:
Fai clic su Aggiungi filtro.
Nel campo Etichetta, seleziona
metric_type
.Nel campo Confronto, seleziona
=~ (equals regex)
.Nel campo Valore, inserisci
.*apiserver.*
o.*kube_pod.*
.
Facoltativamente, raggruppa il numero di campioni importati dalla regione GKE oppure progetto:
Fai clic su Raggruppa per.
Assicurati che metric_type sia selezionato.
Per eseguire il raggruppamento in base alla regione GKE, seleziona Località.
Per raggruppare per progetto, seleziona project_id.
Fai clic su OK.
Se vuoi, raggruppa il numero di campioni importati per nome del cluster GKE:
Fai clic su Raggruppa per.
Per raggruppare in base al nome del cluster GKE, assicurati che sia attribution_dimension e attribution_id.
Fai clic su OK.
Per visualizzare il volume di importazione per ciascuna metrica, seleziona Entrambe nell'opzione di attivazione/disattivazione Tabella del grafico Entrambe. La tabella mostra il volume importato per ogni metrica nella colonna Valore.
Fai clic due volte sull'intestazione della colonna Valore per ordinare le metriche in base a un volume di importazione decrescente.
Questi passaggi mostrano le metriche con la percentuale più alta di campioni importati in e configurazione in Cloud Monitoring. Poiché le metriche nei pacchetti di osservabilità vengono addebitate in base al numero di campioni importati, presta attenzione alle metriche con il tasso di importazione dei campioni più elevato.
Altre metriche
Oltre alle metriche di sistema e ai pacchetti di metriche descritti in questo documento, sono disponibili anche le metriche Istio per i cluster GKE. Per le informazioni sui prezzi, consulta Prezzi di Cloud Monitoring.
Metriche disponibili
La tabella seguente indica i valori supportati per il flag --monitoring
per i comandi create e update.
Origine | Valore --monitoring |
Metriche raccolte |
---|---|---|
Nessuno | NONE |
Nessuna metrica inviata a Cloud Monitoring; nessun agente di raccolta metriche nel cluster. Questo valore non è supportato per i cluster Autopilot. |
Sistema | SYSTEM |
Metriche dei componenti di sistema essenziali richiesti per Kubernetes. Per un elenco completo delle metriche, consulta Metriche Kubernetes. |
server API | API_SERVER |
Metriche di kube-apiserver .
Per un elenco completo delle metriche, consulta
Metriche del server API. |
Pianificazione | SCHEDULER |
Metriche di kube-scheduler .
Per un elenco completo delle metriche, consulta
Metriche dello scheduler.
|
Controller Manager | CONTROLLER_MANAGER |
Metriche di kube-controller-manager .
Per un elenco completo delle metriche, consulta
Metriche del gestore del controller. |
Volume permanente (archiviazione) | STORAGE |
Metriche di archiviazione di kube-state-metrics .
Include le metriche per i volumi permanenti e le richieste di volumi permanenti.
Per un elenco completo delle metriche, consulta
Metriche di archiviazione.
|
Pod | POD |
Metriche del pod da kube-state-metrics .
Per un elenco completo delle metriche, consulta
Metriche dei pod.
|
Implementazione | DEPLOYMENT |
Metriche di deployment da kube-state-metrics .
Per un elenco completo delle metriche, consulta
Metriche di deployment.
|
StatefulSet | STATEFULSET |
Metriche StatefulSet di kube-state-metrics .
Per un elenco completo delle metriche, consulta
Metriche StatefulSet. |
DaemonSet | DAEMONSET |
Metriche DaemonSet da kube-state-metrics .
Per un elenco completo delle metriche, consulta
Metriche DaemonSet.
|
HorizonalPodAutoscaler | HPA |
Metriche HPA di kube-state-metrics .
Consulta un elenco completo
Metriche HorizonalPodAutoscaler.
|
cAdvisor | CADVISOR |
Metriche cAdvisor del pacchetto di metriche cAdvisor/Kubelet. Per un elenco completo delle metriche, consulta Metriche di cAdvisor. |
Kubelet | KUBELET |
Metriche Kubelet da cAdvisor/Kubelet Per un elenco completo delle metriche, consulta Metriche Kubelet. |
Metriche di NVIDIA Data Center GPU Manager (DCGM) | DCGM |
Metriche di NVIDIA Data Center GPU Manager (DCGM). |
Puoi anche raccogliere metriche in stile Prometheus esposte da qualsiasi risorsa GKE carico di lavoro utilizzando Google Cloud Managed Service per Prometheus, che consente di monitorare e creare avvisi sui carichi di lavoro utilizzando Prometheus, senza gestire e utilizzare Prometheus manualmente su larga scala.
Passaggi successivi
- Scopri come risolvere i problemi relativi alle metriche di sistema.