Logging dan pemantauan

Google Distributed Cloud (khusus software) untuk VMware mencakup beberapa opsi untuk pemantauan dan logging cluster, termasuk layanan terkelola berbasis cloud, alat open source, dan kompatibilitas yang divalidasi dengan solusi komersial pihak ketiga. Dokumen ini menjelaskan opsi tersebut dan memberikan beberapa panduan dasar tentang memilih solusi yang tepat untuk lingkungan Anda.

Opsi untuk Google Distributed Cloud

Anda memiliki beberapa opsi logging dan pemantauan untuk Google Distributed Cloud:

Cloud Logging dan Cloud Monitoring

Google Cloud Observability (sebelumnya bernama Stackdriver) adalah solusi kemampuan observasi bawaan untuk Google Cloud. Layanan ini menawarkan solusi logging, pengumpulan metrik, pemantauan, dasbor, dan pemberitahuan yang terkelola sepenuhnya. Cloud Monitoring memantau cluster Google Distributed Cloud dengan cara yang sama seperti cluster GKE berbasis cloud.

Anda dapat mengonfigurasi agen dalam cluster untuk cakupan pemantauan dan logging, serta tingkat metrik yang dikumpulkan:

  • Cakupan logging dan pemantauan dapat disetel hanya untuk komponen sistem (default) atau untuk komponen sistem dan aplikasi
  • Tingkat metrik yang dikumpulkan dapat dikonfigurasi untuk serangkaian metrik yang dioptimalkan atau untuk metrik lengkap

Lihat bagian Mengonfigurasi agen logging dan pemantauan untuk Google Distributed Cloud dalam dokumen ini untuk mengetahui informasi selengkapnya.

Cloud Logging dan Cloud Monitoring menyediakan solusi ideal bagi pelanggan yang menginginkan satu solusi observasi berbasis cloud yang canggih dan mudah dikonfigurasi. Sebaiknya gunakan Logging dan Monitoring saat menjalankan workload hanya di Google Distributed Cloud, atau workload di GKE dan Google Distributed Cloud. Untuk aplikasi dengan komponen yang berjalan di Google Distributed Cloud dan infrastruktur lokal tradisional, Anda dapat mempertimbangkan solusi lain untuk mendapatkan tampilan menyeluruh aplikasi tersebut.

Solusi pihak ketiga

Google telah bekerja sama dengan beberapa penyedia solusi pemantauan dan pencatatan log pihak ketiga untuk membantu produk mereka berfungsi dengan baik di Google Distributed Cloud. Alat ini mencakup Datadog, Elastic, dan Splunk. Pihak ketiga tervalidasi tambahan akan ditambahkan pada masa mendatang.

Untuk mengetahui informasi selengkapnya tentang penggunaan solusi pihak ketiga dengan Google Distributed Cloud, lihat artikel berikut:

Cara kerja logging dan pemantauan untuk Google Distributed Cloud

Agen logging dan pemantauan diinstal dan diaktifkan di setiap cluster saat Anda membuat cluster admin atau pengguna baru. Agen mengumpulkan data tentang komponen sistem—yang cakupannya dapat Anda konfigurasi.

Untuk melihat data yang dikumpulkan di konsol Google Cloud , Anda harus mengonfigurasi Google Cloud project yang menyimpan log dan metrik yang ingin Anda lihat.

Agen logging dan pemantauan di setiap cluster mencakup:

  • Agen metrik GKE (gke-metrics-agent). DaemonSet yang mengirim metrik ke Cloud Monitoring API.

  • Penerus log (stackdriver-log-forwarder). DaemonSet Fluent Bit yang meneruskan log dari setiap mesin ke Cloud Logging. Penerus log menyimpan entri log dalam buffer di node secara lokal dan mengirimkannya kembali hingga empat jam. Jika buffer penuh atau jika penerusan log tidak dapat menjangkau Cloud Logging API selama lebih dari empat jam, log akan dihapus.

  • Agen metrik GKE global (gke-metrics-agent-global). Deployment yang mengirim metrik ke Cloud Monitoring API.

  • Agen metadata (stackdriver-metadata-agent). Deployment yang mengirim metadata untuk resource Kubernetes seperti pod, deployment, atau node ke Stackdriver Resource Metadata API; data ini digunakan untuk memperkaya kueri metrik dengan memungkinkan Anda membuat kueri berdasarkan nama deployment, nama node, atau bahkan nama layanan Kubernetes.

  • kube-state-metrics Deployment yang memantau server API dan membuat metrik tentang status objek.

  • node-exporter DaemonSet yang menghasilkan metrik hardware dan OS.

Anda dapat melihat semua Agen deployment dengan menjalankan perintah berikut:

  kubectl --kubeconfig CLUSTER_KUBECONFIG get deployments -l "managed-by=stackdriver" --all-namespaces

dengan CLUSTER_KUBECONFIG adalah jalur ke file kubeconfig Anda untuk cluster.

Output perintah ini akan mirip dengan berikut ini:

gke-metrics-agent-global                      1/1     Running   0   4h31m
stackdriver-metadata-agent-cluster-level      1/1     Running   0   4h31m

Anda dapat melihat semua agen DaemonSet dengan menjalankan perintah berikut:

  kubectl --kubeconfig CLUSTER_KUBECONFIG get daemonsets -l "managed-by=stackdriver" --all-namespaces

Output perintah ini akan mirip dengan berikut ini:

gke-metrics-agent                             1/1     Running   0   4h31m
stackdriver-log-forwarder                     1/1     Running   0   4h31m

Mengonfigurasi agen logging dan pemantauan untuk Google Distributed Cloud

Agen yang diinstal dengan Google Distributed Cloud mengumpulkan data tentang komponen sistem, sesuai dengan setelan dan konfigurasi Anda, untuk tujuan memelihara dan memecahkan masalah pada cluster Anda.

Hanya komponen sistem (cakupan default)

Setelah penginstalan, agen mengumpulkan log dan metrik, termasuk detail performa (misalnya, penggunaan CPU dan memori) serta metadata serupa, untuk komponen sistem yang disediakan Google. Hal ini mencakup semua workload di cluster admin, dan untuk cluster pengguna, workload di namespace kube-system, gke-system, gke-connect, istio-system, dan config-management-system. Anda dapat mengonfigurasi atau menonaktifkan agen seperti yang dijelaskan di bagian berikut.

Cakupan log dan metrik yang dikumpulkan dapat diperluas untuk menyertakan aplikasi juga. Untuk mengetahui petunjuk cara mengaktifkan logging dan pemantauan aplikasi, lihat Mengaktifkan Logging dan Pemantauan untuk aplikasi pengguna.

Metrik yang dioptimalkan (metrik default)

Secara default, agen metrik yang berjalan di kluster mengumpulkan dan melaporkan serangkaian metrik yang dioptimalkan untuk container, kubelet, dan kube-state-metrics ke Google Cloud Observability (sebelumnya Stackdriver).

Lebih sedikit resource yang diperlukan untuk mengumpulkan kumpulan metrik yang dioptimalkan ini, sehingga meningkatkan performa dan skalabilitas secara keseluruhan. Hal ini sangat penting untuk metrik tingkat container dan tingkat kube, karena banyaknya objek yang harus dipantau.

Untuk menonaktifkan metrik kube-state-metrics yang dioptimalkan (tidak direkomendasikan), tetapkan kolom optimizedMetrics ke false di resource kustom Stackdriver Anda. Untuk mengetahui informasi selengkapnya tentang cara mengubah resource kustom Stackdriver, lihat Mengonfigurasi resource komponen Stackdriver. Semua metrik Google Distributed Cloud, termasuk yang dikecualikan secara default, dijelaskan dalam Metrik Google Distributed Cloud.

Mengaktifkan dan menonaktifkan Stackdriver

Anda dapat mengaktifkan atau menonaktifkan agen logging dan monitoring sepenuhnya dengan mengaktifkan atau menonaktifkan resource kustom Stackdriver. Fitur ini berada dalam Pratinjau.

Sebelum menonaktifkan agen logging dan pemantauan, lihat halaman dukungan untuk mengetahui detail tentang pengaruhnya terhadap SLA Dukungan. Google Cloud

Agen logging dan pemantauan mengambil data yang disimpan secara lokal, tunduk pada konfigurasi penyimpanan dan retensi Anda. Data direplikasi ke project Google Cloudyang ditentukan saat penginstalan menggunakan akun layanan yang diberi otorisasi untuk menulis data ke project tersebut. Anda dapat menonaktifkan agen ini kapan saja, seperti yang dijelaskan sebelumnya.

Anda juga dapat mengelola dan menghapus data yang telah dikirim oleh agen logging dan pemantauan ke Cloud Logging dan Cloud Monitoring. Untuk mengetahui informasi selengkapnya, lihat dokumentasi Cloud Monitoring.

Persyaratan konfigurasi untuk logging dan pemantauan

Untuk melihat data Cloud Logging dan Cloud Monitoring, Anda harus mengonfigurasi Google Cloud project yang menyimpan log dan metrik yang ingin Anda lihat. Project Google Cloud ini disebut project logging-monitoring.

  1. Aktifkan API berikut di project logging-monitoring Anda:

  2. Berikan peran IAM berikut ke akun layanan logging-monitoring di project logging-monitoring Anda.

    • logging.logWriter
    • monitoring.metricWriter
    • stackdriver.resourceMetadata.writer
    • monitoring.dashboardEditor
    • opsconfigmonitoring.resourceMetadata.writer

Tag log

Banyak log Google Distributed Cloud memiliki tag F:

logtag: "F"

Tag ini berarti entri log sudah lengkap atau penuh. Untuk mempelajari lebih lanjut tag ini, lihat Format log dalam proposal desain Kubernetes di GitHub.

Langkah berikutnya