Tentang kemampuan observasi GKE Dataplane V2


Kemampuan observasi GKE Dataplane V2 memberikan metrik dan insight GKE Dataplane V2 tentang workload di cluster GKE di Google Cloud. Dengan kemampuan observasi GKE Dataplane V2, mulai dari GKE versi 1.28 atau yang lebih baru, Anda dapat:

Kemampuan observasi GKE Dataplane V2 menawarkan alat pemecahan masalah berikut:

  • Topologi Jaringan cluster Kubernetes
  • Tabel putusan Kebijakan Jaringan Kubernetes dengan alur traffic live dan informasi koneksi
  • Alat command line untuk memecahkan masalah alur traffic Kubernetes

Metrik GKE Dataplane V2

Metrik GKE Dataplane V2 memberikan informasi alur traffic untuk hal berikut:

  • Alur traffic: insight tentang cara GKE menangani alur antara Pod dan Layanan.
  • Penerapan kebijakan jaringan: informasi tentang cara GKE menerapkan Kebijakan Jaringan Kubernetes.

Anda dapat menggunakan metrik GKE Dataplane V2 untuk memantau dan memecahkan masalah workload Kubernetes menggunakan alat berikut:

  • Google Cloud Managed Service for Prometheus untuk melihat dan menganalisis metrik GKE Dataplane V2 Anda. Anda dapat mengubah konfigurasi Google Cloud Managed Service for Prometheus untuk menambahkan atau menghapus metrik pilihan Anda untuk penyerapan Google Cloud Managed Service for Prometheus.
  • Cloud Monitoring Metrics Explorer untuk melihat detail alur traffic tingkat Pod.
  • Cloud Monitoring untuk menjelajahi dan menggunakan metrik apa pun. Misalnya, Anda dapat membuat pemberitahuan yang terpicu saat metrik GKE Dataplane V2 melebihi batas tertentu.
  • Grafana yang dikelola sendiri untuk memvisualisasikan metrik yang dikumpulkan oleh Google Cloud Managed Service for Prometheus.

Saat Anda mengaktifkan Google Cloud Managed Service for Prometheus:

  • GKE akan membuat resource PodMonitoring
  • GKE akan mengekspos endpoint metrik

Agar dapat menggunakan metrik dengan Google Cloud Managed Service for Prometheus dan mampu membuat resource PodMonitoring, Anda harus mengaktifkan Google Cloud Managed Service for Prometheus di cluster. Jika Anda tidak mengaktifkan Google Cloud Managed Service for Prometheus, GKE akan mengekspos endpoint metrik, tetapi tidak akan membuat resource PodMonitoring.

Saat Anda mengaktifkan metrik GKE Dataplane V2 untuk sebuah cluster, Google Cloud Managed Service for Prometheus akan menyerap metrik GKE Dataplane V2 berikut:

Metrik GKE Dataplane V2 Jenis Deskripsi
prometheus.googleapis.com/pod_flow_egress_flows_count/counter kumulatif Jumlah total alur dari Pod.
prometheus.googleapis.com/pod_flow_ingress_flows_count/counter kumulatif Jumlah total alur ke Pod.

Mengaktifkan metrik GKE Dataplane V2 akan membuka port metrik pada setiap node Kubernetes.

Metrik tambahan juga tersedia, termasuk dari platform kemampuan observasi open source Hubble. Secara default, Google Cloud Managed Service for Prometheus tidak menyerap metrik tambahan ini, tetapi Anda dapat mengonfigurasi Google Cloud Managed Service for Prometheus guna mengumpulkan metrik tersebut. Untuk mengumpulkan metrik ini, konfigurasikan resource kustom (CR) PodMonitoring.

Tabel berikut menjelaskan metrik Hubble tambahan:

Metrik Hubble Jenis Deskripsi
hubble_flows_processed_total kumulatif Jumlah total alur yang diproses.
hubble_drop_total kumulatif Total jumlah alur yang turun.
hubble_port_distribution_total kumulatif Jumlah total alur yang diproses yang digabungkan berdasarkan nomor port.
hubble_tcp_flags_total kumulatif Jumlah total alur yang diproses dengan set flag TCP yang ditentukan.
hubble_icmp_total kumulatif Jumlah total alur ICMP yang diproses.

Alat kemampuan observasi GKE Dataplane V2

Kemampuan observasi GKE Dataplane V2 menyediakan solusi Hubble Terkelola dengan kemampuan observasi jaringan dan insight keamanan untuk workload Kubernetes yang di-deploy dengan GKE Dataplane V2.

Saat diaktifkan, kemampuan observasi GKE Dataplane V2 akan men-deploy komponen berikut ke cluster Anda:

  • Hubble Relay: layanan yang mengumpulkan data telemetri jaringan tentang Pod Anda dari setiap node.

  • Hubble CLI: alat antarmuka command line yang menyediakan informasi traffic live di dalam cluster.

Anda dapat men-deploy komponen berikut setelah mengaktifkan kemampuan observasi GKE Dataplane V2 ke cluster Anda:

  • UI Hubble: alat berbasis web yang dapat digunakan untuk melihat dan menganalisis data telemetri jaringan yang dikumpulkan oleh Hubble Relay. Anda harus mengaktifkan kemampuan observasi GKE Dataplane V2 untuk men-deploy UI Hubble.

Cara kerja metrik dan kemampuan observasi GKE Dataplane V2

Kemampuan observasi GKE Dataplane V2 menggunakan komponen dan alat berikut untuk mengumpulkan metrik serta memberikan insight tentang traffic jaringan Anda:

  • Metrik GKE Dataplane V2: kemampuan observasi dan metrik GKE Dataplane V2 menggunakan jalur data GKE Dataplane V2 berdasarkan eBPF untuk mengumpulkan metrik tentang alur traffic dan penegakan kebijakan jaringan untuk Pod berdasarkan workload tertentu.

  • Google Cloud Managed Service for Prometheus: Metrik GKE Dataplane V2 mengonfigurasi agen Google Cloud Managed Service for Prometheus untuk menyerap metrik gabungan ke Google Cloud Managed Service for Prometheus, solusi pemantauan skalabel yang dapat menyerap dan menyimpan data dalam jumlah besar yang juga memungkinkan Anda mem-build di Google Cloud Observability.

  • Hubble: Kemampuan observasi GKE Dataplane V2 menggunakan Hubble, yakni project kemampuan observasi open source. Hubble mengaktifkan kemampuan observasi jaringan dan insight keamanan untuk workload Kubernetes yang di-deploy dengan Dataplane eBPF.

    Peristiwa alur Hubble terjadi saat:

    • Koneksi jaringan pertama kali dibuat

    • Flag TCP pertama kali terlihat, yang menunjukkan status koneksi TCP

    • Sebuah paket dikirimkan setelah setidaknya lima detik sejak peristiwa alur terakhir

    Metrik Hubble: menghitung jumlah peristiwa alur di cluster Kubernetes yang dapat Anda gunakan untuk mengidentifikasi Pod mana yang saling berkomunikasi.

  • Mengaktifkan metrik dan kemampuan observasi: Anda dapat mengaktifkan GKE Dataplane V2 dan kemampuan observasi secara independen satu sama lain. Untuk mengaktifkan visualisasi topologi jaringan dalam fitur UI Hubble open source, Anda harus mengaktifkan Pemeriksaan jaringan.

  • Cluster Autopilot:

    • Metrik diaktifkan secara default

    • Alat kemampuan observasi dinonaktifkan secara default

    • Anda harus membuat resource PodMonitoring Cluster untuk mengumpulkan metrik di Google Cloud Managed Service for Prometheus

  • Cluster Standard:

    • Metrik dinonaktifkan secara default

    • Alat kemampuan observasi dinonaktifkan secara default

    • Jika Anda mengaktifkan Google Cloud Managed Service for Prometheus, resource PodMonitoring akan dibuat secara otomatis

    • Resource PodMonitoring ditandai sebagai memastikan ada. Anda dapat berhenti mengirim metrik ke Google Cloud Managed Service for Prometheus dengan mengedit resource PodMonitoring untuk menonaktifkan semua metrik

Endpoint kemampuan observasi GKE Dataplane V2

Komponen kemampuan observasi GKE Dataplane V2 mengekspos dua endpoint kemampuan observasi berikut:

  • Endpoint metrik: endpoint HTTP yang menampilkan metrik traffic dalam format Prometheus. Pod anetd mengekspos endpoint metrik di setiap node cluster pada port 9965.

  • Alur port: endpoint gRPC. Pod hubble-relay mengekspos endpoint alur port sebagai Layanan ClusterIP Kubernetes pada port 443. Pod hubble-relay adalah backend untuk Layanan ClusterIP Kubernetes dan semua permintaan ke Layanan ClusterIP Kubernetes diteruskan ke Pod hubble-relay. Anda dapat mengakses alur port menggunakan Hubble CLI atau UI Hubble.

Batasan

  • Kemampuan observasi GKE Dataplane V2 memiliki batas 5.000 node di seluruh cluster.
  • Metrik dan kemampuan observasi GKE Dataplane V2 hanya berfungsi pada cluster di Google Cloud yang mengaktifkan GKE Dataplane V2.
  • Metrik GKE Dataplane V2 mirip dengan metrik Hubble yang diterapkan sebagai metrik berbasis alur untuk memberikan informasi koneksi. Metrik ini tidak menghitung jumlah data atau jumlah paket yang ditransmisikan. Mengingat bahwa metrik berbasis alur, metrik tersebut tidak memberikan representasi yang akurat dari jumlah data yang ditransmisikan dalam alur jaringan.

Langkah selanjutnya