Kemampuan observasi mengacu pada pemantauan sistem, logging, pemberitahuan, dan informasi pelacakan lainnya untuk melihat status dan kondisi infrastruktur dan layanan. Komponen observasi perangkat dengan air gap Google Distributed Cloud (GDC) mengumpulkan log dan metrik yang dapat dilihat di dasbor Grafana dan yang dapat Anda kueri untuk menemukan masalah operasional.
Administrator Platform dapat menggunakan platform Observability untuk memantau cluster sistem dan pengguna serta memvisualisasikan log dan metrik di antarmuka pengguna (UI) Grafana. Operator Aplikasi dapat mengumpulkan data pemantauan dan operasional dalam bentuk log, metrik, dan peristiwa untuk aplikasi mereka.
Platform Observability men-deploy komponen stack-nya di cluster admin dan pengguna. Instance Grafana untuk Administrator Platform mencakup metrik tingkat organisasi, seperti pemakaian CPU dan konsumsi penyimpanan, serta pemberitahuan, log, dan metrik dari komponen yang dapat dioperasikan dari cluster admin, sistem, dan pengguna di GDC.
Instance Grafana untuk Operator Aplikasi tidak menyertakan dasbor atau log default untuk project Anda. Saat Anda membuat dasbor, dasbor tersebut hanya terlihat jika Anda mengaktifkan pengumpulan metrik untuk project Anda.
Komponen platform
Stack pemantauan dan pencatatan log GDC mencakup layanan open source sebagai bagian dari platform Observability. Layanan ini mengumpulkan log dari Pod Kubernetes, mesin bare metal, switch jaringan, dan perangkat penyimpanan.
Tinjau tabel berikut untuk mengetahui detail tentang setiap komponen Observabilitas.
Komponen | Jenis | Cluster | Deskripsi |
---|---|---|---|
anthos-prometheus-k8s |
StatefulSet | Khusus sistem | Prometheus (https://prometheus.io/docs/introduction/overview ): Database deret waktu untuk mengumpulkan dan menyimpan metrik serta mengevaluasi pemberitahuan. Agen ini menambahkan label sebagai pasangan nilai kunci dan mengumpulkan metrik dari node Kubernetes, Pod, mesin bare metal, switch jaringan, dan peralatan penyimpanan. Database menyimpan metrik dari cluster pengguna di cluster yang sama dan menggabungkan metrik dari semua cluster di cluster admin. |
grafana |
StatefulSet | Khusus sistem | Grafana (https://grafana.com/docs/grafana/latest/): Antarmuka pengguna untuk memvisualisasikan dasbor metrik dan pemberitahuan. Lihat metrik yang dikumpulkan Prometheus dan kueri log dari Loki. Hal ini memungkinkan pengguna memvisualisasikan dasbor metrik dan pemberitahuan. |
alertmanager |
StatefulSet | Khusus sistem | Alertmanager (https://prometheus.io/docs/alerting/latest/alertmanager/): Pengelola yang ditentukan pengguna yang mengirimkan pemberitahuan saat log atau metrik menunjukkan bahwa komponen sistem gagal atau tidak beroperasi secara normal. Aplikasi ini mengelola perutean, penonaktifan, dan penggabungan pemberitahuan Prometheus. |
loki |
StatefulSet | Khusus sistem | Loki (https://grafana.com/docs/loki/latest/): Database deret waktu untuk menyimpan log dari berbagai komponen dan menggabungkan log dari semua cluster. |
audit-logs-loki |
StatefulSet | Khusus sistem | Loki: Instance sekunder untuk mengumpulkan log jangka panjang yang diperlukan untuk tujuan audit. Layanan ini mengagregasi log dari semua cluster. |
anthos-log-forwarder |
DaemonSet | Semua cluster | Fluent Bit (https://docs.fluentbit.io/manual): Prosesor yang menarik log dari berbagai komponen dan menyuntikkannya ke Loki. Aplikasi ini mengumpulkan log dari berbagai lokasi, lalu memproses dan meneruskannya. Agen ini berjalan di setiap node dari semua cluster. |
anthos-audit-logs-forwarder |
DaemonSet | Semua cluster | Fluent Bit: Instance sekunder untuk memuat log yang lebih lama untuk tujuan audit. |
audit-log-failure-detector |
DaemonSet | Semua cluster | Komponen GDC yang mendeteksi dan melaporkan kegagalan pengumpulan log audit. Agen ini berjalan di setiap node dari semua cluster. |
logmon-operator |
Deployment | Semua cluster | Operator GDC Logmon yang men-deploy komponen stack Observability. |
GDC juga memanfaatkan resource kustom yang dikembangkan GKE Enterprise untuk mengonfigurasi logging dan pemantauan. Dengan resource kustom ini, Anda dapat mengonfigurasi target scraping dan aturan pemberitahuan Prometheus, konfigurasi Alertmanager, dasbor Grafana, dan target scraping Log.