Mengonfigurasi pengumpulan metrik


Dokumen ini menjelaskan cara mengonfigurasi Google Kubernetes Engine (GKE) untuk mengirim metrik ke Cloud Monitoring. Metrik dalam Cloud Monitoring dapat mengisi dasbor kustom, membuat pemberitahuan, membuat tujuan tingkat layanan, atau diambil oleh layanan pemantauan pihak ketiga menggunakan Cloud Monitoring API.

GKE menyediakan beberapa sumber metrik:

  • Metrik sistem: metrik dari sistem penting komponen, yang menjelaskan sumber daya tingkat rendah seperti CPU, memori, dan penyimpanan.
  • Google Cloud Managed Service for Prometheus: memungkinkan Anda memantau dan memperingatkan workload Anda, menggunakan Prometheus, tanpa harus mengelola dan mengoperasikan Prometheus secara manual.
  • Paket metrik kemampuan observasi:

    • Metrik bidang kontrol: metrik yang diekspor dari komponen bidang kontrol tertentu seperti server API dan penjadwal.
    • Metrik status Kube: kumpulan pilihan metrik yang diekspor dari status kube, yang digunakan untuk memantau status objek Kubernetes seperti Pod, Deployment, dan lain-lain. Untuk kumpulan metrik yang disertakan, lihat Gunakan metrik status kube.

      Paket status kube adalah solusi terkelola. Jika Anda memerlukan fleksibilitas yang lebih besar—misalnya, jika Anda perlu mengumpulkan metrik, atau perlu mengelola interval penyalinan atau resource—Anda dapat menonaktifkan paket, jika diaktifkan, dan men-deploy instance open source Anda sendiri layanan metrik status kube. Untuk selengkapnya informasi selengkapnya, lihat dokumentasi pengekspor Google Cloud Managed Service for Prometheus untuk Kube state metrik.

    • cAdvisor/Kubelet: kumpulan metrik cAdvisor dan Kubelet yang telah diseleksi. Untuk set yang disertakan metrik, melihat Menggunakan metrik cAdvisor/Kubelet.

      Paket cAdvisor/Kubelet adalah solusi terkelola. Jika Anda membutuhkan fleksibilitas yang lebih besar—misalnya, jika Anda perlu mengumpulkan metrik tambahan atau untuk mengelola interval salinan atau resource—Anda dapat menonaktifkan paket, jika diaktifkan, dan men-deploy instance open source Anda sendiri Metrik cAdvisor/Kubelet layanan IT perusahaan mereka. Untuk mengetahui informasi selengkapnya, lihat Google Cloud Managed Service for Prometheus dokumentasi untuk dokumentasi cAdvisor/Kubelet pengekspor.

    • Metrik Pengelola GPU NVIDIA Data Center (DCGM): metrik dari DCGM yang menyediakan tampilan terkait kondisi, performa, dan pemanfaatan GPU.

Metrik sistem

Saat cluster dibuat, GKE secara default mengumpulkan metrik yang dimunculkan oleh komponen sistem.

Anda dapat memilih untuk mengirim metrik dari GKE atau tidak cluster ke Cloud Monitoring. Jika Anda memilih untuk mengirim metrik ke Cloud Monitoring, Anda harus mengirimkan metrik sistem.

Semua metrik sistem GKE diserap ke dalam Cloud Monitoring dengan awalan kubernetes.io.

Harga

Cloud Monitoring tidak mengenakan biaya untuk penyerapan metrik sistem GKE. Untuk informasi selengkapnya, lihat Harga Cloud Monitoring.

Mengonfigurasi pengumpulan metrik sistem

Untuk mengaktifkan pengumpulan metrik sistem, teruskan nilai SYSTEM ke Tanda --monitoring dari gcloud container clusters create atau gcloud container clusters update perintah.

Untuk menonaktifkan pengumpulan metrik sistem, gunakan nilai NONE untuk --monitoring penanda. Jika pengumpulan metrik sistem dinonaktifkan, informasi dasar seperti penggunaan CPU, penggunaan memori, dan penggunaan disk tidak tersedia untuk Tab Kemampuan observasi atau bagian GKE konsol Google Cloud.

Untuk cluster Autopilot GKE, Anda tidak dapat menonaktifkan pengumpulan metrik sistem.

Lihat Kemampuan observasi untuk GKE untuk mengetahui detail lebih lanjut tentang integrasi Cloud Monitoring dengan GKE.

Untuk mengkonfigurasi pengumpulan metrik sistem menggunakan Terraform, melihat blok monitoring_config di Registry Terraform untuk google_container_cluster. Untuk mengetahui informasi umum tentang penggunaan Google Cloud dengan Terraform, lihat Terraform dengan Google Cloud.

Daftar metrik sistem

Metrik sistem mencakup metrik dari komponen sistem penting yang penting untuk Kubernetes. Untuk mengetahui daftar metrik tersebut, lihat Metrik sistem GKE.

Jika Cloud Monitoring diaktifkan untuk cluster, Anda tidak dapat menonaktifkan pemantauan sistem (--monitoring=SYSTEM).

Metrik diaktifkan secara default di GKE Enterprise

Pada tabel berikut, tanda centang () menunjukkan metrik mana yang diaktifkan secara default saat Anda membuat dan daftarkan cluster baru dalam sebuah project dengan GKE Enterprise yang diaktifkan:

Nama metrik Autopilot Standard
Sistem
Server API
Scheduler
Controller Manager
Volume persisten (Penyimpanan)
Pod
Deployment
StatefulState
DaemonSet
HorizonalPodAutoscaler
cAdvisor
Kubelet
Metrik NVIDIA Data Center GPU Manager (DCGM)

Semua cluster terdaftar dalam project yang memiliki GKE Enterprise dapat menggunakan paket untuk metrik bidang kontrol, metrik status kube, dan Metrik cAdvisor/kubelet tanpa biaya tambahan. Jika tidak, metrik ini akan menimbulkan Biaya Cloud Monitoring.

Pemecahan masalah metrik sistem

Jika metrik sistem tidak tersedia di Cloud Monitoring seperti yang diharapkan, lihat Memecahkan masalah metrik sistem.

Paket: Metrik bidang kontrol

Anda dapat mengonfigurasi cluster GKE untuk mengirim metrik tertentu yang dimunculkan oleh server Kubernetes API, Scheduler, dan Controller Manager untuk dan konfigurasi di Cloud Monitoring.

Untuk informasi selengkapnya, lihat Mengumpulkan dan melihat metrik bidang kontrol.

Paket: Metrik status Kube

Anda dapat mengonfigurasi cluster GKE untuk mengirim kumpulan metrik status kube dalam format Prometheus ke Cloud Monitoring. Paket metrik status kube ini mencakup metrik untuk Pod, Deployment, StatefulSets, DaemonSets, resource HorizontalPodAutoscaler, Volume Persisten dan Klaim Volume Persisten.

Untuk informasi selengkapnya, lihat Mengumpulkan dan melihat metrik status Kube.

Paket: metrik cAdvisor/Kubelet

Anda dapat mengonfigurasi cluster GKE untuk mengirim kumpulan Metrik cAdvisor/Kubelet dalam format Prometheus menjadi dan konfigurasi di Cloud Monitoring. Kumpulan metrik yang diseleksi adalah subkumpulan sejumlah besar metrik cAdvisor/Kubelet yang disertakan dalam Deployment Kubernetes secara default. cAdvisor/Kubelet pilihan dirancang untuk menyediakan metrik yang paling berguna, sehingga mengurangi volume penyerapan dan biaya terkait.

Untuk informasi selengkapnya, lihat Kumpulkan dan lihat metrik cAdvisor/Kubelet.

Paket: Metrik NVIDIA Data Center GPU Manager (DCGM)

Anda dapat memantau pemakaian, performa, dan kondisi GPU dengan mengonfigurasi GKE untuk dikirim Metrik Pengelola GPU NVIDIA Data Center (DCGM) Anda untuk dan konfigurasi di Cloud Monitoring.

Untuk informasi selengkapnya, lihat Kumpulkan dan lihat metrik NVIDIA Data Center GPU Manager (DCGM).

Nonaktifkan paket metrik

Anda dapat menonaktifkan penggunaan paket metrik di cluster. Anda mungkin ingin nonaktifkan paket tertentu untuk mengurangi biaya atau jika Anda menggunakan paket mekanisme pengumpulan metrik, seperti Google Cloud Managed Service for Prometheus dan pengekspor.

Konsol

Untuk menonaktifkan pengumpulan metrik dari Detail untuk cluster, lakukan langkah berikut:

  1. Di Google Cloud Console, buka halaman Cluster Kubernetes:

    Buka cluster Kubernetes

    Jika Anda menggunakan bilah pencarian untuk menemukan halaman ini, kemudian pilih hasil yang sub judulnya Kubernetes Engine.

  2. Klik nama cluster Anda.

  3. Di baris Features berlabel Cloud Monitoring, klik ikon Edit.

  4. Di menu drop-down Komponen, hapus centang komponen metrik yang ingin dinonaktifkan.

  5. Klik Oke.

  6. Klik Simpan Perubahan.

gcloud

  1. Membuka jendela terminal dengan Google Cloud SDK dan Google Cloud CLI terinstal. Salah satu cara untuk melakukannya adalah dengan menggunakan Cloud Shell.

  2. Di konsol Google Cloud, aktifkan Cloud Shell.

    Aktifkan Cloud Shell

    Di bagian bawah Google Cloud Console, Cloud Shell sesi akan terbuka dan menampilkan perintah command line. Cloud Shell adalah lingkungan shell dengan Google Cloud CLI yang sudah terinstal, dan dengan nilai yang sudah ditetapkan untuk project Anda saat ini. Diperlukan waktu beberapa detik untuk melakukan inisialisasi sesi.

  3. Panggil gcloud container clusters update perintah dan teruskan kumpulan nilai yang telah diupdate ke --monitoring penanda. Kumpulan nilai yang diberikan ke flag --monitoring mengganti setelan sebelumnya.

    Misalnya, untuk menonaktifkan pengumpulan semua metrik kecuali metrik sistem, jalankan perintah berikut:

    gcloud container clusters update CLUSTER_NAME \
        --location=COMPUTE_LOCATION \
        --enable-managed-prometheus \
        --monitoring=SYSTEM
    

    Perintah ini menonaktifkan pengumpulan data konfigurasi paket metrik.

Terraform

Untuk mengonfigurasi kumpulan metrik menggunakan Terraform, melihat blok monitoring_config di Registry Terraform untuk google_container_cluster. Untuk mengetahui informasi umum tentang penggunaan Google Cloud dengan Terraform, lihat Terraform dengan Google Cloud.

Memahami tagihan Monitoring Anda

Anda dapat menggunakan Cloud Monitoring untuk mengidentifikasi bidang kontrol atau status kube yang menulis jumlah sampel terbesar. Metrik ini memberikan kontribusi pada biaya Anda. Setelah mengidentifikasi metrik yang paling mahal, Anda dapat modifikasi konfigurasi scrape untuk memfilter metrik ini dengan benar.

Halaman Metrics Management Cloud Monitoring menyediakan informasi yang dapat membantu Anda mengontrol jumlah pembelanjaan untuk metrik yang dapat ditagih tanpa memengaruhi kemampuan observasi. Halaman Pengelolaan Metrik melaporkan informasi berikut:

  • Volume penyerapan untuk penagihan berbasis byte dan sampel, di seluruh metrik domain dan untuk metrik individual.
  • Data tentang label dan kardinalitas metrik.
  • Penggunaan metrik dalam kebijakan pemberitahuan dan dasbor kustom.
  • Tingkat error penulisan metrik.

Untuk menampilkan halaman Pengelolaan Metrik, lakukan hal berikut:

  1. Di Konsol Google Cloud, buka Halaman Pengelolaan metrik:

    Buka Pengelolaan metrik

    Jika Anda menggunakan bilah pencarian untuk menemukan halaman ini, kemudian pilih hasil yang sub judulnya Pemantauan.

  2. Di toolbar, pilih periode waktu Anda. Secara default, Halaman Pengelolaan Metrik menampilkan informasi tentang metrik yang dikumpulkan dalam satu hari sebelumnya.

Untuk informasi selengkapnya tentang halaman Pengelolaan Metrik, lihat Melihat dan mengelola penggunaan metrik.

Untuk mengidentifikasi metrik bidang kontrol atau status kube yang memiliki jumlah sampel yang diserap terbesar, lakukan hal berikut:

  1. Di Konsol Google Cloud, buka Halaman Pengelolaan metrik:

    Buka Pengelolaan metrik

    Jika Anda menggunakan bilah pencarian untuk menemukan halaman ini, kemudian pilih hasil yang sub judulnya Pemantauan.

  2. Pada kartu skor Sampel yang dapat ditagih yang diserap, klik Lihat diagram.

  3. Cari diagram Penyerapan Volume Namespace, lalu klik  Opsi diagram lainnya.

  4. Di kolom Metric, pastikan resource dan dan metrik dipilih:
    Metric Ingestion Attribution dan Samples written by attribution id.

  5. Di halaman Filter, lakukan hal berikut:

    1. Di kolom Label, pastikan nilainya adalah attribution_dimension.

    2. Di kolom Comparison, verifikasi bahwa nilainya adalah = (equals).

    3. Di kolom Value, pilih cluster.

  6. Hapus setelan Group by.

  7. Atau, filter hanya untuk metrik tertentu. Misalnya, API bidang kontrol semua metrik server menyertakan "apiserver" sebagai bagian dari nama metrik, dan Semua metrik Pod status kube menyertakan "kube_pod" sebagai bagian dari nama metrik, sehingga Anda dapat memfilter metrik yang berisi string tersebut:

    • Klik Tambahkan Filter.

    • Di kolom Label, pilih metric_type.

    • Di kolom Comparison, pilih =~ (equals regex).

    • Di kolom Nilai, masukkan .*apiserver.* atau .*kube_pod.*.

  8. Atau, kelompokkan jumlah sampel yang diserap oleh region GKE atau proyek:

    • Klik Kelompokkan menurut.

    • Pastikan metric_type dipilih.

    • Untuk mengelompokkan berdasarkan region GKE, pilih lokasi.

    • Untuk mengelompokkan berdasarkan project, pilih project_id.

    • Klik Oke.

  9. Anda juga dapat mengelompokkan jumlah sampel yang diserap oleh nama cluster GKE:

    • Klik Kelompokkan menurut.

    • Untuk mengelompokkan berdasarkan nama cluster GKE, pastikan attribution_dimension dan attribution_id dipilih.

    • Klik Oke.

  10. Untuk melihat volume penyerapan untuk setiap metrik, buka berlabel Chart Table Two, pilih Both. Tabel menunjukkan volume yang diserap untuk setiap metrik dalam Kolom Nilai.

    Klik header kolom Nilai dua kali untuk mengurutkan metrik berdasarkan volume penyerapan menurun.

Langkah-langkah ini menunjukkan metrik dengan tingkat sampel tertinggi yang diserap dan konfigurasi di Cloud Monitoring. Karena metrik dalam paket kemampuan observasi dikenai biaya berdasarkan jumlah sampel yang diserap, bayar perhatian pada metrik dengan tingkat sampel tertinggi yang diserap.

Metrik lainnya

Selain metrik sistem dan paket metrik yang dijelaskan dalam dokumen ini, Metrik Istio juga tersedia untuk Cluster GKE. Untuk mengetahui informasi harga, lihat Harga Cloud Monitoring.

Metrik yang tersedia

Tabel berikut menunjukkan nilai yang didukung untuk flag --monitoring bagi membuat dan update.

Sumber Nilai --monitoring Metrik yang Dikumpulkan
Tidak ada NONE Tidak ada metrik yang dikirim ke Cloud Monitoring; tidak ada agen pengumpulan metrik yang diinstal di cluster. Nilai ini tidak didukung untuk Cluster Autopilot.
Sistem SYSTEM Metrik dari komponen sistem penting yang diperlukan untuk Kubernetes. Untuk mengetahui daftar lengkap metrik, lihat Metrik Kubernetes.
Server API API_SERVER Metrik dari kube-apiserver. Untuk mengetahui daftar lengkap metrik, lihat Metrik server API.
Scheduler SCHEDULER Metrik dari kube-scheduler. Untuk mengetahui daftar lengkap metrik, lihat Metrik Scheduler.
Pengelola Pengontrol CONTROLLER_MANAGER Metrik dari kube-controller-manager. Untuk mengetahui daftar lengkap metrik, lihat Metrik Pengelola Pengontrol.
Volume persisten (Penyimpanan) STORAGE Metrik penyimpanan dari kube-state-metrics. Mencakup metrik untuk Klaim Volume Persisten dan Volume Persisten. Untuk mengetahui daftar lengkap metrik, lihat Metrik penyimpanan.
Pod POD Metrik pod dari kube-state-metrics. Untuk mengetahui daftar lengkap metrik, lihat Metrik pod.
Deployment DEPLOYMENT Metrik deployment dari kube-state-metrics. Untuk mengetahui daftar lengkap metrik, lihat Metrik deployment.
StatefulSet STATEFULSET Metrik StatefulSet dari kube-state-metrics. Untuk mengetahui daftar lengkap metrik, lihat Metrik StatefulSet.
DaemonSet DAEMONSET Metrik DaemonSet dari kube-state-metrics. Untuk mengetahui daftar lengkap metrik, lihat Metrik DaemonSet.
HorizonalPodAutoscaler HPA Metrik HPA dari kube-state-metrics. Lihat daftar lengkap Metrik HorizonalPodAutoscaler.
cAdvisor CADVISOR Metrik cAdvisor dari cAdvisor/Kubelet paket metrik. Untuk mengetahui daftar lengkap metrik, lihat Metrik cAdvisor.
Kubelet KUBELET Metrik Kubelet dari cAdvisor/Kubelet Untuk mengetahui daftar lengkap metrik, lihat Metrik Kubelet.
Metrik NVIDIA Data Center GPU Manager (DCGM) DCGM Metrik dari NVIDIA Data Center GPU Manager (DCGM).

Anda juga dapat mengumpulkan metrik bergaya Prometheus yang diekspos oleh GKE workload menggunakan Google Cloud Managed Service for Prometheus, yang memungkinkan Anda memantau dan memberikan peringatan tentang beban kerja Anda, menggunakan Prometheus, tanpa harus mengelola dan mengoperasikan Prometheus secara manual.

Langkah selanjutnya