Memantau status kondisi

Halaman ini menjelaskan cara mengakses dasbor status kondisi untuk memantau dan mengidentifikasi potensi masalah.

Status kondisi membantu Anda memvisualisasikan metrik penting infrastruktur appliance air-gapped Google Distributed Cloud (GDC) dan memberikan ringkasan tingkat tinggi tentang kondisi komponen. Memvisualisasikan dasbor status kesehatan membantu Anda mengidentifikasi akar masalah, mendiagnosis perilaku, dan mendapatkan konteks tambahan selama penyelidikan untuk menyelesaikan masalah.

GDC memantau dan memberikan status kesehatan untuk setiap komponen hardware dan software yang mencakup:

  • Hardware: node server
  • Software: cluster, VM, dan penyimpanan

Dasbor status respons memungkinkan Anda memvisualisasikan metrik yang digunakan setiap komponen untuk mengukur status pemantauan.

Sebelum memulai

Cluster root berisi instance Grafana untuk operator infrastruktur. Instance Grafana ini berisi dasbor status health.

Anda memerlukan kontrol akses berbasis peran untuk mengakses visualisasi data dengan aman di dasbor instance Grafana. Oleh karena itu, ikuti petunjuk di bagian Sebelum Anda memulai untuk membuat kueri dan melihat metrik di dasbor guna mengakses dasbor di instance Grafana.

Endpoint Grafana

Buka salah satu URL berikut untuk mengakses endpoint Grafana dari project infra-obs atau cluster admin root:

  • Endpoint Grafana untuk proyek infra-obs:

    https://GDC_URL/infra-obs/grafana
    

    Ganti GDC_URL dengan URL organisasi di GDC.

  • Endpoint Grafana dari cluster admin root:

    https://ROOT_ADMIN_CLUSTER_URL/grafana
    

    Ganti ROOT_ADMIN_CLUSTER_URL dengan URL cluster admin root di GDC.

Contoh kasus penggunaan

Bagian ini menyertakan contoh cara menggunakan dasbor untuk kasus praktis.

Penyesuaian performa

Jika komponen berperforma buruk, tetapi tidak selalu memengaruhi SLO atau memicu pemberitahuan, Anda dapat berkomunikasi secara proaktif dengan developer dan mencegah terjadinya masalah di masa mendatang.

Demikian juga, komponen mungkin ingin mengetahui cara kerja fiturnya untuk membuat kompromi performa yang tepat. Status kesehatan adalah salah satu mekanisme untuk mengumpulkan informasi yang dibutuhkan komponen.

Pengembangan fitur

Misalkan pelanggan meminta perubahan atau GDC berencana merilis fitur baru. Dalam hal ini, Anda dapat mengamati status respons untuk komponen yang relevan guna menentukan kelayakan dukungan untuk fitur atau perubahan baru. Selain itu, status kesehatan dapat digunakan untuk membuat keputusan produk saat memprioritaskan pekerjaan.

Misalnya, anggaplah sebuah komponen memiliki latensi rata-rata 500 md dan ingin menguranginya menjadi 250 md. Dalam hal ini, tim dapat menghitung biaya relatif pengurangan inkremental sebesar 50% dan membandingkannya dengan mendesain endpoint dengan waktu respons 250 md.