Logging e monitoraggio

Google Distributed Cloud (solo software) per VMware include più opzioni per il logging e il monitoraggio dei cluster, compresi i servizi gestiti basati su cloud, strumenti di origine e compatibilità convalidata con soluzioni commerciali di terze parti. Il presente documento illustra queste opzioni e fornisce alcune indicazioni di base su la scelta della soluzione più adatta al tuo ambiente.

Opzioni per Google Distributed Cloud

Sono disponibili diverse opzioni di logging e monitoraggio per Google Distributed Cloud:

Cloud Logging e Cloud Monitoring

Google Cloud Observability (in precedenza Stackdriver) è la soluzione di osservabilità integrata per in Google Cloud. Offre una soluzione di logging completamente gestita, metriche raccolta, monitoraggio, creazione di dashboard e avvisi. Cloud Monitoring monitora i cluster Google Distributed Cloud in modo simile a quelli basati su cloud cluster GKE.

Puoi configurare gli agenti nel cluster per l'ambito del monitoraggio e del logging, nonché il livello di metriche raccolte:

  • L'ambito del logging e del monitoraggio può essere impostato solo sui componenti di sistema (il predefinita) o per componenti e applicazioni di sistema
  • Il livello di metriche raccolte può essere configurato per un insieme ottimizzato di metriche o per le metriche complete

Consulta Configurazione degli agenti di logging e monitoraggio per Anthos clusters on VMware in questo documento.

Cloud Logging e Cloud Monitoring forniscono la soluzione ideale per i clienti che desiderano un'unica soluzione basata su cloud potente e facile da configurare di osservabilità. Consigliamo vivamente Logging e Monitoraggio solo quando i carichi di lavoro vengono eseguiti Google Distributed Cloud o carichi di lavoro su GKE Google Distributed Cloud. Per le applicazioni con componenti in esecuzione di Google Distributed Cloud e la tradizionale infrastruttura on-premise, prendere in considerazione altre soluzioni per una visione end-to-end di queste applicazioni.

Soluzioni di terze parti

Google ha collaborato con diverse soluzioni di logging e monitoraggio di terze parti in modo che i loro prodotti funzionino bene con Google Distributed Cloud. tra cui Datadog, Elastic e Splunk. Altre terze parti convalidate verranno aggiunti in futuro.

Per ulteriori informazioni sull'utilizzo di soluzioni di terze parti con Google Distributed Cloud, verifica quanto segue:

Come funzionano il logging e il monitoraggio per Google Distributed Cloud

Gli agenti Logging e Monitoring vengono installati e attivati quando crei un nuovo cluster di amministrazione o utente. Gli agenti raccolgono dati sui componenti di sistema, l'ambito che puoi configurare.

Per visualizzare i dati raccolti nella console Google Cloud, devi configurare il progetto Google Cloud in cui sono archiviati i log e le metriche che vuoi visualizzare.

Gli agenti di logging e monitoraggio su ciascun cluster includono:

  • Agente metriche GKE (gke-metrics-agent). Un DaemonSet che invia metriche all'API Cloud Monitoring.

  • Log forwarding (stackdriver-log-forwarder). Un DaemonSet Fluent Bit che inoltra i log da ogni macchina a Cloud Logging. Il server di inoltro log memorizza il log sul nodo in locale e le invia di nuovo per un massimo di quattro ore. Se il buffer si riempie o se il forwarding dei log non riesce a raggiungere l'API Cloud Logging per più di quattro ore, poi i log vengono eliminati.

  • Agente delle metriche GKE globale (gke-metrics-agent-global). R Deployment che invia metriche all'API Cloud Monitoring.

  • Agente metadati (stackdriver-metadata-agent). R Deployment che invia metadati per risorse Kubernetes come pod, deployment o nodi all'API Stackdriver Resource Metadata; questo I dati vengono utilizzati per arricchire le query sulle metriche, permettendo il nome del deployment, del nodo o persino il nome del servizio Kubernetes.

  • kube-state-metrics, un deployment che ascolta il server API e generare metriche sugli stati degli oggetti.

  • node-exporter Un DaemonSet che genera metriche hardware e del sistema operativo.

Puoi visualizzare tutti gli agenti Deployment eseguendo questo comando :

  kubectl --kubeconfig CLUSTER_KUBECONFIG get deployments -l "managed-by=stackdriver" --all-namespaces

dove CLUSTER_KUBECONFIG è il percorso del file kubeconfig per il cluster.

L'output di questo comando è simile al seguente:

gke-metrics-agent-global                      1/1     Running   0   4h31m
stackdriver-metadata-agent-cluster-level      1/1     Running   0   4h31m

Puoi visualizzare tutti gli agenti DaemonSet eseguendo questo :

  kubectl --kubeconfig CLUSTER_KUBECONFIG get daemonsets -l "managed-by=stackdriver" --all-namespaces

L'output di questo comando è simile al seguente:

gke-metrics-agent                             1/1     Running   0   4h31m
stackdriver-log-forwarder                     1/1     Running   0   4h31m

Configurazione degli agenti di logging e monitoraggio per Google Distributed Cloud

Gli agenti installati con Google Distributed Cloud raccolgono dati sui componenti di sistema, in base alle impostazioni e alla configurazione dell'utente, per per la manutenzione e la risoluzione dei problemi relativi ai cluster.

Solo componenti di sistema (ambito predefinito)

Al momento dell'installazione, gli agenti raccolgono log e metriche, tra cui dettagli sulle prestazioni (ad esempio, utilizzo di CPU e memoria) e simili metadati per i componenti di sistema forniti da Google. Includono tutti i carichi di lavoro nel cluster di amministrazione e, per i cluster utente, i carichi di lavoro nel sistema kube-system, Spazi dei nomi gke-system, gke-connect, istio-system e config-management-system. Puoi configurare o disabilitare gli agenti come descritto in le sezioni seguenti.

L'ambito dei log e delle metriche raccolti può essere esteso per includere anche le applicazioni. Per istruzioni su come abilitare il logging e il monitoraggio dell'applicazione, consulta Abilitazione di Logging e Monitoring per le applicazioni utente.

Metriche ottimizzate (metriche predefinite)

Per impostazione predefinita, gli agenti delle metriche in esecuzione nel cluster raccolgono e segnalano un set ottimizzato di metriche di container, kubelet e kube-state-metrics per Google Cloud Observability (in precedenza Stackdriver).

Sono necessarie meno risorse per raccogliere questo dato un insieme ottimizzato di metriche, che migliora le prestazioni e la scalabilità complessive. Ciò è particolarmente importante per le metriche a livello di container e kube, a causa delle grandi quantità di oggetti da monitorare.

Per disabilitare le metriche kube-state-metrics ottimizzate (non consigliato), imposta il campo optimizedMetrics a false nella tua risorsa personalizzata di Stackdriver. Per ulteriori informazioni sulla modifica la tua risorsa personalizzata di Stackdriver, consulta Configurazione delle risorse del componente Stackdriver. Tutte le metriche Google Distributed Cloud, incluse quelle escluse per impostazione predefinita, descritte in Metriche di GKE Enterprise.

Abilita e disabilita Stackdriver

Puoi abilitare o disabilitare completamente gli agenti di logging e monitoraggio abilitando o disattivando la configurazione risorsa. Questa funzionalità è in anteprima.

Prima di disabilitare gli agenti di logging e monitoraggio, consulta l'assistenza per informazioni dettagliate su come questo influisce sugli SLA dell'assistenza Google Cloud.

Gli agenti di logging e monitoraggio acquisiscono i dati archiviati localmente, in base alle tue esigenze di archiviazione e configurazione della conservazione. I dati vengono replicati in Google Cloud specificato al momento dell'installazione utilizzando un account di servizio autorizzato a scrivere dati in quel progetto. Puoi disabilitare questi agenti in qualsiasi momento, descritti in precedenza.

Puoi anche gestire ed eliminare i dati che gli agenti di logging e monitoraggio hanno inviato a Cloud Logging e Cloud Monitoring. Per ulteriori informazioni, vedi documentazione di Cloud Monitoring.

Requisiti di configurazione per il logging e il monitoraggio

Per visualizzare i dati di Cloud Logging e Cloud Monitoring, devi configurare il progetto Google Cloud in cui sono archiviati i log le metriche che vuoi visualizzare. Questo progetto Google Cloud è chiamato progetto di monitoraggio del logging.

  1. Abilita le seguenti API nel tuo progetto di monitoraggio dei log:

  2. Concedi i seguenti ruoli IAM ai tuoi account di servizio logging-monitoraggio sul tuo progetto di monitoraggio dei log.

    • logging.logWriter
    • monitoring.metricWriter
    • stackdriver.resourceMetadata.writer
    • monitoring.dashboardEditor
    • opsconfigmonitoring.resourceMetadata.writer

Prezzi

Non è previsto alcun costo per i log di sistema e le metriche di GKE Enterprise. I log e le metriche del piano di controllo un sottoinsieme selezionato di metriche di stato Kube sono attivata per impostazione predefinita per cluster GKE su Google Cloud registrati al momento della creazione del cluster in un progetto abilitato per GKE Enterprise. I log del piano di controllo sono soggetti agli addebiti di Cloud Logging, mentre le metriche attive per impostazione predefinita sono inclusi senza costi aggiuntivi.

Per l'elenco delle metriche e dei log GKE inclusi, consulta Quali log vengono raccolti e Metriche disponibili.

In un cluster Google Distributed Cloud, log di sistema e metriche di GKE Enterprise include:

  • Log e metriche di tutti i componenti in un cluster di amministrazione
  • Log e metriche dei componenti nei seguenti spazi dei nomi di un cluster utente: kube-system, gke-system, gke-connect, knative-serving, istio-system, monitoring-system, config-management-system, gatekeeper-system, cnrm-system

Per ulteriori informazioni, vedi Prezzi per Google Cloud Observability.

Per saperne di più sul merito per le metriche di Cloud Logging, contatta il team di vendita per i prezzi.

Passaggi successivi