Informazioni sull'osservabilità di GKE Dataplane V2


L'osservabilità di GKE Dataplane V2 fornisce metriche e approfondimenti su GKE Dataplane V2 nei workload sui cluster GKE su Google Cloud. Con l'osservabilità di GKE Dataplane V2, a partire dalle versioni GKE 1.28 o successive, puoi:

L'osservabilità di GKE Dataplane V2 offre i seguenti strumenti di risoluzione dei problemi:

  • Un Network Topology del cluster Kubernetes
  • Una tabella dei risultati dei criteri di rete Kubernetes con flussi di traffico in tempo reale e informazioni sulla connessione
  • Strumenti a riga di comando per la risoluzione dei problemi dei flussi di traffico Kubernetes

Metriche di GKE Dataplane V2

Le metriche di GKE Dataplane V2 forniscono informazioni sul flusso di traffico per quanto segue:

  • Flussi di traffico:informazioni su come GKE gestisce i flussi tra pod e servizi.
  • Applicazione dei criteri di rete:informazioni su come GKE applica i criteri di rete Kubernetes.

Puoi utilizzare le metriche di GKE Dataplane V2 per monitorare e risolvere i problemi relativi ai carichi di lavoro Kubernetes utilizzando i seguenti strumenti:

  • Google Cloud Managed Service per Prometheus per visualizzare e analizzare le metriche di GKE Dataplane V2. Puoi modificare la configurazione di Google Cloud Managed Service per Prometheus per aggiungere o rimuovere le metriche che preferisci per l'importazione di Google Cloud Managed Service per Prometheus.
  • Metrics Explorer di Cloud Monitoring per visualizzare i dettagli del flusso di traffico a livello di pod.
  • Cloud Monitoring per esplorare e utilizzare qualsiasi metrica. Ad esempio, puoi creare avvisi che vengono attivati quando le metriche di GKE Dataplane V2 superano determinate soglie.
  • Grafana autogestito per visualizzare le metriche raccolte da Google Cloud Managed Service per Prometheus.

Quando abiliti Google Cloud Managed Service per Prometheus:

  • GKE crea una risorsa PodMonitoring
  • GKE espone l'endpoint delle metriche

Per utilizzare le metriche con Google Cloud Managed Service per Prometheus e per poter creare una risorsa PodMonitoring, devi abilitare Google Cloud Managed Service per Prometheus sul cluster. Se non abiliti Google Cloud Managed Service per Prometheus, GKE espone l'endpoint delle metriche, ma non crea una risorsa PodMonitoring.

Quando abiliti le metriche GKE Dataplane V2 per un cluster, Google Cloud Managed Service per Prometheus importa le seguenti metriche GKE Dataplane V2:

Metrica GKE Dataplane V2 Tipo Descrizione
prometheus.googleapis.com/pod_flow_egress_flows_count/counter cumulativo Numero totale di flussi da un pod.
prometheus.googleapis.com/pod_flow_ingress_flows_count/counter cumulativo Numero totale di flussi verso un pod.

L'abilitazione delle metriche di GKE Dataplane V2 apre la porta delle metriche su ogni nodo Kubernetes.

Sono disponibili anche altre metriche, tra cui quelle della piattaforma di osservabilità open source Hubble. Per impostazione predefinita, Google Cloud Managed Service per Prometheus non importa queste metriche aggiuntive, ma puoi configurare Google Cloud Managed Service per Prometheus in modo che le raccolga. Per raccogliere queste metriche, configura una PodMonitoringrisorsa personalizzata (CR).

La tabella seguente descrive le metriche Hubble aggiuntive:

Metrica Hubble Tipo Descrizione
hubble_flows_processed_total cumulativo Numero totale di flussi elaborati.
hubble_drop_total cumulativo Numero totale di flussi eliminati.
hubble_port_distribution_total cumulativo Numero totale di flussi elaborati aggregati per numero di porta.
hubble_tcp_flags_total cumulativo Numero totale di flussi elaborati con i flag TCP specificati impostati.
hubble_icmp_total cumulativo Numero totale di flussi ICMP elaborati.

Strumenti di osservabilità di GKE Dataplane V2

L'osservabilità GKE Dataplane V2 fornisce una soluzione Hubble gestita con informazioni sulla sicurezza e sull'osservabilità della rete per i carichi di lavoro Kubernetes di cui è stato eseguito il deployment con GKE Dataplane V2.

Se abilitata, l'osservabilità di GKE Dataplane V2 esegue il deployment dei seguenti componenti nel cluster:

  • Hubble Relay:un servizio che raccoglie i dati di telemetria di rete relativi ai tuoi pod da ogni nodo.

  • Hubble CLI: uno strumento di interfaccia a riga di comando che fornisce informazioni sul traffico in tempo reale all'interno del cluster.

Puoi eseguire il deployment del seguente componente dopo aver abilitato l'osservabilità di GKE Dataplane V2 nel cluster:

  • Interfaccia utente di Hubble:uno strumento basato sul web che puoi utilizzare per visualizzare e analizzare i dati di telemetria di rete raccolti da Hubble Relay. Per eseguire il deployment della UI di Hubble, devi abilitare l'osservabilità di GKE Dataplane V2.

Come funzionano le metriche e l'osservabilità di GKE Dataplane V2

L'osservabilità di GKE Dataplane V2 utilizza i seguenti componenti e strumenti per raccogliere metriche e fornire approfondimenti sul traffico di rete:

  • GKE Dataplane V2: le metriche e l'osservabilità di GKE Dataplane V2 utilizzano il percorso dei dati di GKE Dataplane V2 basato su eBPF per raccogliere metriche sui flussi di traffico e sull'applicazione dei criteri di rete per un pod in base a un determinato workload.

  • Google Cloud Managed Service per Prometheus: la configurazione delle metriche di GKE Dataplane V2 configura l'agente Google Cloud Managed Service per Prometheus per importare le metriche aggregate in Google Cloud Managed Service per Prometheus, una soluzione di monitoraggio scalabile in grado di importare e archiviare grandi quantità di dati che ti consente anche di creare su Google Cloud Observability.

  • Hubble: l'osservabilità di GKE Dataplane V2 utilizza Hubble, un progetto di osservabilità open source. Hubble consente l'osservabilità della rete e gli approfondimenti sulla sicurezza per i carichi di lavoro Kubernetes di cui è stato eseguito il deployment con un dataplane eBPF.

    Gli eventi di flusso Hubble si verificano quando:

    • Viene stabilita prima una connessione di rete

    • Viene visualizzato per la prima volta un flag TCP, che indica lo stato della connessione TCP

    • Un pacchetto viene trasmesso dopo almeno cinque secondi dall'ultimo evento di flusso

    Metriche Hubble:conteggia il numero di eventi di flusso in un cluster Kubernetes che puoi utilizzare per identificare i pod che comunicano tra loro.

  • Abilitazione di metriche e osservabilità:puoi abilitare GKE Dataplane V2 e l'osservabilità indipendentemente l'uno dall'altra. Per abilitare la visualizzazione di Network Topology nella funzionalità della UI di Hubble open source, devi abilitare l'ispezione di rete.

  • Cluster Autopilot:

    • Le metriche sono attive per impostazione predefinita

    • Gli strumenti di osservabilità sono disattivati per impostazione predefinita

    • Devi creare la risorsa ClusterPodMonitoring per raccogliere le metriche in Google Cloud Managed Service per Prometheus

  • Cluster standard:

    • Le metriche sono disattivate per impostazione predefinita

    • Gli strumenti di osservabilità sono disattivati per impostazione predefinita

    • Se hai abilitato Google Cloud Managed Service per Prometheus, viene creata automaticamente una risorsa PodMonitoring

    • Una risorsa PodMonitoring è contrassegnata come ensure exists. Puoi interrompere l'invio di metriche a Google Cloud Managed Service per Prometheus modificando la risorsa PodMonitoring per disattivare tutte le metriche.

Endpoint di osservabilità di GKE Dataplane V2

I componenti di osservabilità di GKE Dataplane V2 espongono i seguenti due endpoint di osservabilità:

  • Endpoint delle metriche:un endpoint HTTP che espone le metriche del traffico in formato Prometheus. Il pod anetd espone l'endpoint delle metriche su ogni nodo del cluster sulla porta 9965.

  • Porta dei flussi:un endpoint gRPC. Il pod hubble-relay espone l'endpoint della porta dei flussi come servizio ClusterIP Kubernetes sulla porta 443. Il pod hubble-relay è il backend del servizio Kubernetes ClusterIP e tutte le richieste al servizio Kubernetes ClusterIP vengono inoltrate al pod hubble-relay. Puoi accedere alla porta di flusso utilizzando Hubble CLI o l'interfaccia utente di Hubble.

Limitazioni

  • L'osservabilità di GKE Dataplane V2 ha un limite a livello di cluster di 5000 nodi.
  • Le metriche e l'osservabilità di GKE Dataplane V2 funzionano solo nei cluster su Google Cloud con GKE Dataplane V2 abilitato.
  • Le metriche di GKE Dataplane V2 sono simili alle metriche di Hubble in quanto sono implementate come metriche basate sul flusso per fornire informazioni sulla connessione. Queste metriche non conteggiano la quantità di dati né il numero di pacchetti trasmessi. Poiché le metriche sono basate sul flusso, non forniscono una rappresentazione accurata della quantità di dati trasmessi in un flusso di rete.

Passaggi successivi