Halaman ini menjelaskan metrik OpenTelemetry yang tersedia untuk memantau resource Config Sync Anda.
Config Sync menggunakan OpenCensus untuk membuat dan merekam metrik, serta OpenTelemetry untuk mengekspor metriknya ke Prometheus dan Cloud Monitoring. Anda dapat mengekspor metrik OpenTelemetry ke sistem pemantauan lain. Panduan berikut menjelaskan cara mengekspor metrik:
Metrik OpenTelemetry
Config Sync dan Pengontrol Grup Resource mengumpulkan metrik berikut dengan OpenCensus dan menyediakannya melalui kolektor OpenTelemetry . Kolom Tag mencantumkan tag khusus Config Sync yang berlaku untuk setiap metrik. Metrik dengan tag mewakili beberapa pengukuran, satu untuk setiap kombinasi nilai tag.
Metrik Config Sync
Nama | Jenis | Tag | Deskripsi |
---|---|---|---|
api_duration_seconds | Distribusi | operasi, status | Distribusi latensi panggilan server API. |
apply_duration_seconds | Distribusi | status | Distribusi latensi penerapan resource yang dideklarasikan dari sumber tepercaya ke cluster. |
apply_operations_total | Jumlah | operasi, status, pengontrol | Jumlah total operasi yang telah dilakukan untuk menyinkronkan resource dari sumber tepercaya ke cluster. |
declared_resources | Nilai Terakhir | Jumlah resource yang dideklarasikan yang diuraikan dari Git. | |
internal_errors_total | Jumlah | sumber | Jumlah total error internal yang dialami oleh Config Sync. Metrik mungkin tidak muncul di hasil kueri jika tidak ada error internal yang terjadi. |
last_sync_timestamp | Nilai Terakhir | status | Stempel waktu sinkronisasi terbaru dari Git. |
parser_duration_seconds | Distribusi | status, pemicu, sumber | Distribusi latensi berbagai tahap yang terlibat dalam sinkronisasi dari sumber tepercaya ke cluster. |
pipeline_error_observed | Nilai Terakhir | nama, rekonsiliasi, komponen | Status resource kustom RootSync dan RepoSync. Nilai 1 menunjukkan kegagalan. |
reconcile_duration_seconds | Distribusi | status | Distribusi latensi peristiwa rekonsiliasi yang ditangani oleh manajer rekonsiliasi. |
reconciler_errors | Nilai Terakhir | komponen, {i>errorclass<i} | Jumlah error yang ditemukan saat menyinkronkan resource dari sumber tepercaya ke cluster. |
remediate_duration_seconds | Distribusi | status | Distribusi latensi peristiwa remediator remediator. |
resource_conflicts_total | Jumlah | Jumlah total konflik resource yang diakibatkan oleh ketidakcocokan antara resource cluster dan resource yang di-cache. Metrik mungkin tidak muncul di hasil kueri jika tidak ada konflik resource yang terjadi. | |
resource_fights_total | Jumlah | Jumlah total resource yang terlalu sering disinkronkan. Setiap hasil yang lebih tinggi dari nol menunjukkan masalah. Untuk mengetahui informasi selengkapnya, lihat KNV2005: ResourceFightWarning. Metrik mungkin tidak muncul di hasil kueri jika tidak ada pertarungan resource yang terjadi. |
Metrik Pengontrol Grup Resource
Pengontrol Grup Resource adalah komponen di Config Sync yang melacak resource terkelola dan memeriksa apakah setiap resource telah siap atau direkonsiliasi. Metrik berikut tersedia.
Nama | Jenis | Tag | Deskripsi |
---|---|---|---|
rg_reconcile_duration_seconds | Distribusi | Stallreason | Distribusi waktu yang diperlukan untuk merekonsiliasi CR ResourceGroup |
resource_group_total | Nilai Terakhir | Jumlah CR ResourceGroup saat ini | |
resource_count | Nilai Terakhir | grup resource | Jumlah total resource yang dilacak oleh ResourceGroup |
ready_resource_count | Nilai Terakhir | grup resource | Jumlah total resource yang siap di ResourceGroup |
resource_ns_count | Nilai Terakhir | grup resource | Jumlah namespace yang digunakan oleh resource di ResourceGroup |
cluster_scoped_resource_count | Nilai Terakhir | grup resource | Jumlah resource cakupan cluster di ResourceGroup |
crd_count | Nilai Terakhir | grup resource | Jumlah CRD di ResourceGroup |
kcc_resource_count | Nilai Terakhir | grup resource | Jumlah total resource KCC di ResourceGroup |
pipeline_error_observed | Nilai Terakhir | nama, rekonsiliasi, komponen | Status resource kustom RootSync dan RepoSync. Nilai 1 menunjukkan kegagalan. |
Label metrik Config Sync
Label metrik dapat digunakan untuk menggabungkan data metrik di Cloud Monitoring dan Prometheus. Opsi ini dapat dipilih dari menu drop-down "Group By" di Monitoring Console.
Untuk mengetahui informasi selengkapnya tentang label Cloud Monitoring dan label metrik Prometheus, baca Komponen model metrik dan Model data Prometheus.
Label metrik
Label berikut digunakan oleh metrik Config Sync dan Pengontrol Grup Resource, yang tersedia saat melakukan pemantauan dengan Cloud Monitoring dan Prometheus.
Nama | Nilai | Deskripsi |
---|---|---|
operation |
buat, patch, perbarui, hapus | Jenis operasi yang dijalankan |
status |
berhasil, error | Status eksekusi operasi |
reconciler |
rootsync, reposync | Jenis Reconciler |
source |
parser, berbeda, remediator | Sumber error internal |
trigger |
coba lagi, watchUpdate, managementConflict, sinkronisasi ulang, impor ulang | Pemicu peristiwa rekonsiliasi |
name |
Nama rekonsiliasi | Nama Rekonsiliasi |
component |
penguraian, sumber, sinkronisasi, rendering, kesiapan | Nama komponen / tahap rekonsiliasi saat ini |
container |
rekonsiler, git-sync | Nama penampung |
resource |
cpu, memori | Jenis resource |
controller |
applier, remediator | Nama pengontrol pada rekonsiler root atau namespace |
type |
Semua resource Kubernetes, misalnya ClusterRole, Namespace, NetworkPolicy, Role, dan sebagainya. | Jenis Kubernetes API |
commit |
---- | Hash commit terbaru yang disinkronkan |
Label resource
Metrik Config Sync yang dikirim ke Prometheus dan Cloud Monitoring memiliki label metrik berikut yang ditetapkan untuk mengidentifikasi Pod sumber:
Nama | Deskripsi |
---|---|
k8s.node.name |
Nama Node yang menghosting Pod Kubernetes |
k8s.pod.namespace |
Namespace Pod |
k8s.pod.uid |
UID Pod |
k8s.pod.ip |
IP Pod |
k8s.deployment.name |
Nama Deployment yang memiliki Pod |
Metrik Config Sync yang dikirim ke Prometheus dan Cloud Monitoring dari Pod reconciler
juga memiliki label metrik berikut yang ditetapkan untuk mengidentifikasi RootSync atau RepoSync yang digunakan untuk mengonfigurasi rekonsiler:
Nama | Deskripsi |
---|---|
configsync.sync.kind |
Jenis resource yang mengonfigurasi rekonsiler ini: RootSync atau RepoSync |
configsync.sync.name |
Nama RootSync atau RepoSync yang mengonfigurasi rekonsiler ini |
configsync.sync.namespace |
Namespace RootSync atau RepoSync yang mengonfigurasi rekonsiler ini |
Label resource Cloud Monitoring
Label Resource Cloud Monitoring digunakan untuk mengindeks metrik dalam penyimpanan. Artinya, label tersebut memiliki efek yang dapat diabaikan terhadap kardinalitas, tidak seperti label metrik, di mana kardinalitas merupakan masalah performa yang signifikan. Lihat Jenis Resource yang Dipantau untuk informasi selengkapnya.
Jenis resource k8s_container
menetapkan label resource berikut untuk mengidentifikasi Penampung sumber:
Nama | Deskripsi |
---|---|
container_name |
Nama Container |
pod_name |
Nama Pod |
namespace_name |
Namespace Pod |
location |
Region atau zona cluster yang menghosting node |
cluster_name |
Nama cluster yang menghosting node |
project |
ID project yang menghosting cluster |
Memahami metrik pipeline_error_obfilled
Metrik pipeline_error_observed
adalah metrik yang dapat membantu Anda mengidentifikasi dengan cepat CR RepoSync atau RootSync yang tidak sinkron atau berisi resource yang tidak direkonsiliasi ke status yang diinginkan.
Agar sinkronisasi berhasil oleh RootSync atau RepoSync, metrik dengan semua komponen (
rendering
,source
,sync
,readiness
) diamati dengan nilai 0.Jika commit terbaru gagal rendering otomatis, metrik dengan komponen
rendering
diamati dengan nilai 1.Saat memeriksa commit terbaru menemukan error atau commit terbaru berisi konfigurasi yang tidak valid, metrik dengan komponen
source
diamati dengan nilai 1.Jika resource gagal diterapkan ke cluster, metrik dengan komponen
sync
diamati dengan nilai 1.Jika resource diterapkan, tetapi gagal mencapai status yang diinginkan, metrik dengan komponen
readiness
diamati dengan nilai 1. Misalnya, Deployment diterapkan ke cluster, tetapi Pod yang terkait tidak berhasil dibuat.
Langkah selanjutnya
- Pelajari lebih lanjut cara memantau objek RootSync dan RepoSync.
- Pelajari cara menggunakan SLI Config Sync.