Halaman ini diterjemahkan oleh Cloud Translation API.

Mengonfigurasi logging dan pemantauan

Google Distributed Cloud (khusus software) untuk bare metal mendukung beberapa opsi untuk pencatatan dan pemantauan cluster, termasuk layanan terkelola berbasis cloud, alat open source, dan kompatibilitas yang divalidasi dengan solusi komersial pihak ketiga. Halaman ini menjelaskan opsi tersebut dan memberikan panduan dasar tentang cara memilih solusi yang tepat untuk lingkungan Anda.

Halaman ini ditujukan bagi Admin, arsitek, dan Operator yang ingin memantau kondisi aplikasi atau layanan yang di-deploy, seperti untuk kepatuhan terhadap tujuan tingkat layanan (SLO). Untuk mempelajari lebih lanjut peran umum dan contoh tugas yang dirujuk dalam konten Google Cloud , lihat Peran dan tugas pengguna GKE umum.

Opsi untuk Google Distributed Cloud

Anda memiliki beberapa opsi logging dan pemantauan untuk cluster Anda:

Cloud Logging dan Cloud Monitoring, diaktifkan secara default pada komponen sistem bare metal.
Prometheus dan Grafana tersedia dari Cloud Marketplace.
Konfigurasi yang divalidasi dengan solusi pihak ketiga.

Cloud Logging dan Cloud Monitoring

Google Cloud Observability adalah solusi kemampuan observasi bawaan untuk Google Cloud. Layanan ini menawarkan solusi logging, pengumpulan metrik, pemantauan, dasbor, dan pemberitahuan yang terkelola sepenuhnya. Cloud Monitoring memantau cluster Google Distributed Cloud dengan cara yang sama seperti cluster GKE berbasis cloud.

Cloud Logging dan Cloud Monitoring diaktifkan secara default saat Anda membuat cluster dengan akun layanan dan peran Identity and Access Management (IAM) yang diperlukan. Anda tidak dapat menonaktifkan Cloud Logging dan Cloud Monitoring. Untuk mengetahui informasi selengkapnya tentang akun layanan dan peran yang diperlukan, lihat Mengonfigurasi akun layanan.

Agen dapat dikonfigurasi untuk mengubah hal berikut:

Cakupan logging dan pemantauan, dari hanya komponen sistem (default) hingga komponen sistem dan aplikasi.
Tingkat metrik yang dikumpulkan, dari hanya sekumpulan metrik yang dioptimalkan (default) hingga semua metrik.

Lihat Mengonfigurasi agen Stackdriver untuk Google Distributed Cloud di dokumen ini untuk mengetahui informasi selengkapnya.

Logging dan Monitoring menyediakan satu solusi observasi berbasis cloud yang canggih dan mudah dikonfigurasi. Sebaiknya gunakan Logging dan Monitoring saat menjalankan workload di Google Distributed Cloud. Untuk aplikasi dengan komponen yang berjalan di Google Distributed Cloud dan infrastruktur lokal standar, Anda dapat mempertimbangkan solusi lain untuk mendapatkan tampilan menyeluruh aplikasi tersebut.

Untuk mengetahui detail tentang arsitektur, konfigurasi, dan data yang direplikasi ke project Anda secara default, lihat Cara kerja Logging dan Monitoring untuk Google Distributed Cloud. Google Cloud
Untuk mengetahui informasi selengkapnya tentang Logging, lihat dokumentasi Cloud Logging.
Untuk mengetahui informasi selengkapnya tentang Monitoring, lihat dokumentasi Cloud Monitoring.
Untuk mempelajari cara melihat dan menggunakan metrik pemanfaatan resource Cloud Monitoring dari Google Distributed Cloud di tingkat armada, lihat Menggunakan ringkasan Google Kubernetes Engine.

Prometheus dan Grafana

Prometheus dan Grafana adalah dua produk pemantauan open source populer yang tersedia di Cloud Marketplace:

Prometheus mengumpulkan metrik aplikasi dan sistem.
Alertmanager menangani pengiriman pemberitahuan dengan beberapa mekanisme pemberitahuan yang berbeda.
Grafana adalah alat dasbor.

Sebaiknya gunakan Google Cloud Managed Service for Prometheus, yang berbasis di Cloud Monitoring, untuk semua kebutuhan pemantauan Anda. Dengan Google Cloud Managed Service for Prometheus, Anda dapat memantau komponen sistem tanpa biaya. Google Cloud Managed Service for Prometheus juga kompatibel dengan Grafana. Namun, jika Anda lebih memilih sistem pemantauan lokal murni, Anda dapat memilih untuk menginstal Prometheus dan Grafana di cluster Anda.

Jika Anda menginstal Prometheus secara lokal dan ingin mengumpulkan metrik dari komponen sistem, Anda harus memberikan izin ke instance Prometheus lokal Anda untuk mengakses endpoint metrik komponen sistem:

Ikat akun layanan untuk instance Prometheus Anda ke gke-metrics-agentClusterRole yang telah ditentukan sebelumnya, dan gunakan token akun layanan sebagai kredensial untuk menyalin metrik dari komponen sistem berikut:
- kube-apiserver
- kube-scheduler
- kube-controller-manager
- kubelet
- node-exporter
Gunakan kunci dan sertifikat klien yang disimpan di secret kube-system/stackdriver-prometheus-etcd-scrape untuk mengautentikasi pengambilan metrik dari etcd.
Buat NetworkPolicy untuk mengizinkan akses dari namespace Anda ke kube-state-metrics.

Solusi pihak ketiga

Google telah bekerja sama dengan beberapa penyedia solusi pemantauan dan pencatatan log pihak ketiga untuk membantu produk mereka berfungsi dengan baik di Google Distributed Cloud. Alat ini mencakup Datadog, Elastic, dan Splunk. Pihak ketiga tervalidasi lainnya akan ditambahkan pada masa mendatang.

Panduan solusi berikut tersedia untuk menggunakan solusi pihak ketiga dengan Google Distributed Cloud:

Cara kerja Logging dan Monitoring untuk Google Distributed Cloud

Cloud Logging dan Cloud Monitoring diinstal dan diaktifkan di setiap cluster saat Anda membuat cluster admin atau pengguna baru.

Agen Stackdriver mencakup beberapa komponen di setiap cluster:

Stackdriver Operator (stackdriver-operator-*). Mengelola siklus proses untuk semua agen Stackdriver lainnya yang di-deploy ke cluster.
Stackdriver Custom Resource. Resource yang dibuat secara otomatis sebagai bagian dari proses penginstalan Google Distributed Cloud.
GKE Metrics Agent (gke-metrics-agent-*). DaemonSet berbasis OpenTelemetry Collector yang meng-scrape metrik dari setiap node ke Cloud Monitoring. DaemonSet node-exporter dan deployment kube-state-metrics juga disertakan untuk memberikan lebih banyak metrik tentang cluster.
Stackdriver Log Forwarder (stackdriver-log-forwarder-*). DaemonSet Fluent Bit yang meneruskan log dari setiap mesin ke Cloud Logging. Penerus log menyimpan entri log dalam buffer di node secara lokal dan mengirimkannya ulang hingga 4 jam. Jika buffer penuh atau jika Penerusan Log tidak dapat menjangkau Cloud Logging API selama lebih dari 4 jam, log akan dihapus.

Catatan: Agen Metadata tersedia untuk Pratinjau dan tercakup dalam Persyaratan Penawaran Pra-GA dari Persyaratan Layanan Google Cloud. Produk pra-GA mungkin memiliki dukungan terbatas, dan perubahan pada produk pra-GA mungkin tidak kompatibel dengan versi pra-GA lainnya. Untuk mengetahui informasi selengkapnya, lihat deskripsi tahap peluncuran.
Metadata Agent (stackdriver-metadata-agent-). Deployment yang mengirim metadata untuk resource Kubernetes seperti pod, deployment, atau node ke Config Monitoring for Ops API. Penambahan metadata ini memungkinkan Anda mengkueri data metrik menurut nama deployment, nama node, atau bahkan nama layanan Kubernetes.

Anda dapat melihat agen yang diinstal oleh Stackdriver dengan menjalankan perintah berikut:

kubectl -n kube-system get pods -l "managed-by=stackdriver"

Output perintah ini akan mirip dengan berikut ini:

kube-system   gke-metrics-agent-4th8r                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-8lt4s                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-dhxld                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-lbkl2                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-pblfk                                     1/1     Running   1 (40h ago)   40h
kube-system   gke-metrics-agent-qfwft                                     1/1     Running   1 (40h ago)   40h
kube-system   kube-state-metrics-9948b86dd-6chhh                          1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-5s4pg                                         1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-d9gwv                                         1/1     Running   2 (40h ago)   40h
kube-system   node-exporter-fhbql                                         1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-gzf8t                                         1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-tsrpp                                         1/1     Running   1 (40h ago)   40h
kube-system   node-exporter-xzww7                                         1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-log-forwarder-8lwxh                             1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-log-forwarder-f7cgf                             1/1     Running   2 (40h ago)   40h
kube-system   stackdriver-log-forwarder-fl5gf                             1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-log-forwarder-q5lq8                             1/1     Running   2 (40h ago)   40h
kube-system   stackdriver-log-forwarder-www4b                             1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-log-forwarder-xqgjc                             1/1     Running   1 (40h ago)   40h
kube-system   stackdriver-metadata-agent-cluster-level-5bb5b6d6bc-z9rx7   1/1     Running   1 (40h ago)   40h

Metrik Cloud Monitoring

Untuk mengetahui daftar metrik yang dikumpulkan oleh Cloud Monitoring, lihat Melihat metrik Google Distributed Cloud.

Mengonfigurasi agen Stackdriver untuk Google Distributed Cloud

Agen Stackdriver yang diinstal dengan Google Distributed Cloud mengumpulkan data tentang komponen sistem untuk tujuan pemeliharaan dan pemecahan masalah pada cluster Anda. Bagian berikut menjelaskan konfigurasi dan mode operasi Stackdriver.

Hanya Komponen Sistem (Mode Default)

Setelah penginstalan, agen Stackdriver dikonfigurasi secara default untuk mengumpulkan log dan metrik, termasuk detail performa (misalnya, penggunaan CPU dan memori), dan metadata serupa, untuk komponen sistem yang disediakan Google. Hal ini mencakup semua workload di cluster admin, dan untuk cluster pengguna, workload di namespace kube-system, gke-system, gke-connect, istio-system, dan config-management-system.

Komponen dan Aplikasi Sistem

Untuk mengaktifkan logging dan pemantauan aplikasi di atas mode default, ikuti langkah-langkah di bagian Mengaktifkan logging dan pemantauan aplikasi.

Metrik yang dioptimalkan (Metrik default)

Secara default, deployment kube-state-metrics yang berjalan di cluster mengumpulkan dan melaporkan serangkaian metrik kube yang dioptimalkan ke Google Cloud Observability (sebelumnya Stackdriver).

Lebih sedikit resource yang diperlukan untuk mengumpulkan kumpulan metrik yang dioptimalkan ini, sehingga meningkatkan performa dan skalabilitas secara keseluruhan.

Metrik kube yang dikecualikan

Metrik kube berikut dikecualikan dari metrik yang dioptimalkan:

kube_certificatesigningrequest_cert_length
kube_certificatesigningrequest_condition
kube_certificatesigningrequest_created
kube_certificatesigningrequest_labels
kube_configmap_annotations
kube_configmap_info
kube_configmap_labels
kube_configmap_metadata_resource_version
kube_daemonset_annotations
kube_daemonset_created
kube_daemonset_labels
kube_daemonset_metadata_generation
kube_daemonset_status_observed_generation
kube_deployment_annotations
kube_deployment_created
kube_deployment_labels
kube_deployment_spec_paused
kube_deployment_spec_strategy_rollingupdate_max_surge
kube_deployment_spec_strategy_rollingupdate_max_unavailable
kube_deployment_status_condition
kube_deployment_status_replicas_ready
kube_endpoint_annotations
kube_endpoint_created
kube_endpoint_info
kube_endpoint_labels
kube_endpoint_ports
kube_horizontalpodautoscaler_annotations
kube_horizontalpodautoscaler_info
kube_horizontalpodautoscaler_labels
kube_horizontalpodautoscaler_metadata_generation
kube_horizontalpodautoscaler_status_condition
kube_job_annotations
kube_job_complete
kube_job_created
kube_job_info
kube_job_labels
kube_job_owner
kube_job_spec_completions
kube_job_spec_parallelism
kube_job_status_completion_time
kube_job_status_start_time
kube_job_status_succeeded
kube_lease_owner
kube_lease_renew_time
kube_limitrange
kube_limitrange_created
kube_mutatingwebhookconfiguration_info
kube_namespace_labels
kube_networkpolicy_annotations
kube_networkpolicy_labels
kube_networkpolicy_spec_egress_rules
kube_networkpolicy_spec_ingress_rules
kube_node_annotations
kube_node_role
kube_persistentvolume_annotations
kube_persistentvolume_labels
kube_persistentvolumeclaim_access_mode
kube_persistentvolumeclaim_annotations
kube_persistentvolumeclaim_labels
kube_pod_annotations
kube_pod_completion_time
kube_pod_container_resource_limits
kube_pod_container_resource_requests
kube_pod_container_state_started
kube_pod_created
kube_pod_init_container_info
kube_pod_init_container_resource_limits
kube_pod_init_container_resource_requests
kube_pod_init_container_status_last_terminated_reason
kube_pod_init_container_status_ready
kube_pod_init_container_status_restarts_total
kube_pod_init_container_status_running
kube_pod_init_container_status_terminated
kube_pod_init_container_status_terminated_reason
kube_pod_init_container_status_waiting
kube_pod_init_container_status_waiting_reason
kube_pod_labels
kube_pod_owner
kube_pod_restart_policy
kube_pod_spec_volumes_persistentvolumeclaims_readonly
kube_pod_start_time
kube_poddisruptionbudget_annotations
kube_poddisruptionbudget_created
kube_poddisruptionbudget_labels
kube_poddisruptionbudget_status_expected_pods
kube_poddisruptionbudget_status_observed_generation
kube_poddisruptionbudget_status_pod_disruptions_allowed
kube_replicaset_annotations
kube_replicaset_created
kube_replicaset_labels
kube_replicaset_metadata_generation
kube_replicaset_owner
kube_replicaset_status_observed_generation
kube_resourcequota_created
kube_secret_annotations
kube_secret_info
kube_secret_labels
kube_secret_metadata_resource_version
kube_secret_type
kube_service_annotations
kube_service_created
kube_service_info
kube_service_labels
kube_service_spec_type
kube_statefulset_annotations
kube_statefulset_created
kube_statefulset_labels
kube_statefulset_status_current_revision
kube_statefulset_status_update_revision
kube_storageclass_annotations
kube_storageclass_created
kube_storageclass_info
kube_storageclass_labels
kube_validatingwebhookconfiguration_info
kube_validatingwebhookconfiguration_metadata_resource_version
kube_volumeattachment_created
kube_volumeattachment_info
kube_volumeattachment_labels
kube_volumeattachment_spec_source_persistentvolume
kube_volumeattachment_status_attached
kube_volumeattachment_status_attachment_metadata

Kumpulan lengkap metrik Google Distributed Cloud didokumentasikan dalam Melihat metrik Anthos.

Untuk menonaktifkan metrik yang dioptimalkan (tidak direkomendasikan), ganti setelan default di resource kustom Stackdriver Anda.

Menggunakan Google Cloud Managed Service for Prometheus untuk komponen sistem tertentu

Google Cloud Managed Service for Prometheus adalah bagian dari Cloud Monitoring dan tersedia sebagai opsi untuk komponen sistem. Manfaat Google Cloud Managed Service for Prometheus mencakup hal berikut:

Anda dapat terus menggunakan pemantauan berbasis Prometheus yang ada tanpa mengubah pemberitahuan dan dasbor Grafana.
Jika menggunakan GKE dan Google Distributed Cloud, Anda dapat menggunakan Prometheus Query Language (PromQL) yang sama untuk metrik di semua cluster Anda. Anda juga dapat menggunakan tab PromQL di Metrics Explorer di konsol Google Cloud .

Mengaktifkan dan menonaktifkan Google Cloud Managed Service for Prometheus

Mulai dari rilis Google Distributed Cloud 1.30.0-gke.1930, Google Cloud Managed Service for Prometheus selalu diaktifkan. Pada versi sebelumnya, Anda dapat mengedit resource Stackdriver, stackdriver, untuk mengaktifkan atau menonaktifkan Google Cloud Managed Service for Prometheus. Untuk menonaktifkan Google Cloud Managed Service for Prometheus untuk versi cluster sebelum 1.30.0-gke.1930, tetapkan spec.featureGates.enableGMPForSystemMetrics di resource stackdriver ke false.

Melihat data metrik

Jika enableGMPForSystemMetrics disetel ke true, metrik untuk komponen berikut memiliki format yang berbeda untuk cara penyimpanan dan kuerinya di Cloud Monitoring:

kube-apiserver
kube-scheduler
kube-controller-manager
kubelet dan cadvisor
kube-state-metrics
node-exporter

Dalam format baru, Anda dapat membuat kueri metrik sebelumnya menggunakan Prometheus Query Language (PromQL).

Contoh kueri PromQL:

histogram_quantile(0.95, sum(rate(apiserver_request_duration_seconds_bucket[5m])) by (le))

Mengonfigurasi dasbor Grafana dengan Google Cloud Managed Service for Prometheus

Untuk menggunakan Grafana dengan data metrik dari Google Cloud Managed Service for Prometheus, Anda harus mengonfigurasi dan mengautentikasi sumber data Grafana terlebih dahulu. Untuk mengonfigurasi dan mengautentikasi sumber data, Anda menggunakan penyinkron sumber data (datasource-syncer) untuk membuat kredensial OAuth2 dan menyinkronkannya ke Grafana melalui API sumber data Grafana. Penyinkron sumber data menetapkan Cloud Monitoring API sebagai URL server Prometheus (nilai URL dimulai dengan https://monitoring.googleapis.com) di bagian sumber data di Grafana.

Ikuti langkah-langkah di Membuat kueri menggunakan Grafana untuk mengautentikasi dan mengonfigurasi sumber data Grafana guna membuat kueri data dari Google Cloud Managed Service for Prometheus.

Kumpulan dasbor Grafana contoh disediakan di repositori anthos-samples di GitHub. Untuk menginstal dasbor contoh, lakukan hal berikut:

Download contoh file JSON:

git clone https://github.com/GoogleCloudPlatform/anthos-samples.git
cd anthos-samples/gmp-grafana-dashboards

Jika sumber data Grafana Anda dibuat dengan nama yang berbeda dengan Managed Service for Prometheus, ubah kolom datasource di semua file JSON:
```
sed -i "s/Managed Service for Prometheus/[DATASOURCE_NAME]/g" ./*.json
```
Ganti [DATASOURCE_NAME] dengan nama sumber data di Grafana yang mengarah ke layanan frontend Prometheus.
Akses UI Grafana dari browser Anda, lalu pilih + Import di menu Dashboards.
Upload file JSON, atau salin dan tempel konten file, lalu pilih Muat. Setelah konten file berhasil dimuat, pilih Impor. Secara opsional, Anda juga dapat mengubah nama dan UID dasbor sebelum mengimpor.
Dasbor yang diimpor akan berhasil dimuat jika Google Distributed Cloud dan sumber data Anda dikonfigurasi dengan benar. Misalnya, screenshot berikut menampilkan dasbor yang dikonfigurasi oleh cluster-capacity.json.

Referensi lainnya

Untuk mengetahui informasi selengkapnya tentang Google Cloud Managed Service for Prometheus, lihat artikel berikut:

Mengonfigurasi resource komponen Stackdriver

Saat Anda membuat cluster, Google Distributed Cloud akan otomatis membuat resource kustom Stackdriver. Anda dapat mengedit spesifikasi di resource kustom untuk mengganti nilai default permintaan dan batas CPU serta memori untuk komponen Stackdriver, dan Anda dapat mengganti setelan metrik yang dioptimalkan default secara terpisah.

Mengganti permintaan dan batas CPU dan memori default untuk komponen Stackdriver

Cluster dengan kepadatan pod yang tinggi menimbulkan overhead logging dan pemantauan yang lebih tinggi. Dalam kasus ekstrem, komponen Stackdriver dapat melaporkan penggunaan CPU dan memori yang mendekati batas atau bahkan dapat mengalami mulai ulang yang konstan karena batas resource. Dalam hal ini, untuk mengganti nilai default permintaan dan batas CPU dan memori untuk komponen Stackdriver, gunakan langkah-langkah berikut:

Jalankan perintah berikut untuk membuka resource kustom Stackdriver di editor command line:
```
kubectl -n kube-system edit stackdriver stackdriver
```

Di resource kustom Stackdriver, tambahkan bagian resourceAttrOverride di bawah kolom spec:

resourceAttrOverride:
      DAEMONSET_OR_DEPLOYMENT_NAME/CONTAINER_NAME:
        LIMITS_OR_REQUESTS:
          RESOURCE: RESOURCE_QUANTITY

Perhatikan bahwa bagian resourceAttrOverride menggantikan semua batas dan permintaan default yang ada untuk komponen yang Anda tentukan. Komponen berikut didukung oleh resourceAttrOverride:

gke-metrics-agent/gke-metrics-agent
stackdriver-log-forwarder/stackdriver-log-forwarder
stackdriver-metadata-agent-cluster-level/metadata-agent
node-exporter/node-exporter
kube-state-metrics/kube-state-metrics

Contoh file terlihat seperti berikut:

apiVersion: addons.gke.io/v1alpha1
kind: Stackdriver
metadata:
  name: stackdriver
  namespace: kube-system
spec:
  anthosDistribution: baremetal
  projectID: my-project
  clusterName: my-cluster
  clusterLocation: us-west-1a
  resourceAttrOverride:
    gke-metrics-agent/gke-metrics-agent:
      requests:
        cpu: 110m
        memory: 240Mi
      limits:
        cpu: 200m
        memory: 4.5Gi

Untuk menyimpan perubahan pada resource kustom Stackdriver, simpan dan keluar dari editor command line Anda.

Periksa kondisi Pod Anda:

kubectl -n kube-system get pods -l "managed-by=stackdriver"

Respons untuk Pod yang sehat akan terlihat seperti berikut:

gke-metrics-agent-4th8r                1/1     Running   1   40h

Periksa spesifikasi Pod komponen untuk memastikan resource disetel dengan benar.

kubectl -n kube-system describe pod POD_NAME

Ganti POD_NAME dengan nama Pod yang baru saja Anda ubah. Contoh, gke-metrics-agent-4th8r.

Responsnya akan terlihat seperti berikut:

  Name:         gke-metrics-agent-4th8r
  Namespace:    kube-system
  ...
  Containers:
    gke-metrics-agent:
      Limits:
        cpu: 200m
        memory: 4.5Gi
      Requests:
        cpu: 110m
        memory: 240Mi
      ...

Menonaktifkan metrik yang dioptimalkan

Secara default, deployment kube-state-metrics yang berjalan di cluster mengumpulkan dan melaporkan serangkaian metrik kube yang dioptimalkan ke Stackdriver. Jika Anda memerlukan metrik tambahan, sebaiknya temukan penggantinya dari daftar metrik Google Distributed Cloud.

Berikut beberapa contoh penggantian yang dapat Anda gunakan:

Metrik yang dinonaktifkan	Penggantian
`kube_pod_start_time`	`container/uptime`
`kube_pod_container_resource_requests`	`container/cpu/request_cores` `container/memory/request_bytes`
`kube_pod_container_resource_limits`	`container/cpu/limit_cores` `container/memory/limit_bytes`

Untuk menonaktifkan setelan default metrik yang dioptimalkan (tidak direkomendasikan), lakukan hal berikut:

Buka resource kustom Stackdriver di editor command line:
```
kubectl -n kube-system edit stackdriver stackdriver
```

Tetapkan kolom optimizedMetrics ke false:

apiVersion: addons.gke.io/v1alpha1
kind: Stackdriver
metadata:
name: stackdriver
namespace: kube-system
spec:
anthosDistribution: baremetal
projectID: my-project
clusterName: my-cluster
clusterLocation: us-west-1a
optimizedMetrics: false

Simpan perubahan, lalu keluar dari editor command line.

Server Metrik

Metrics Server adalah sumber metrik resource container untuk berbagai pipeline penskalaan otomatis. Server Metrik mengambil metrik dari kubelet dan mengeksposnya melalui Kubernetes Metrics API. HPA dan VPA kemudian menggunakan metrik ini untuk menentukan waktu untuk memicu penskalaan otomatis. Server metrik diskalakan menggunakan pengubah ukuran add-on.

Dalam kasus ekstrem saat kepadatan pod yang tinggi menyebabkan overhead logging dan pemantauan yang terlalu besar, Metrics Server dapat dihentikan dan dimulai ulang karena batasan resource. Dalam hal ini, Anda dapat mengalokasikan lebih banyak resource ke server metrik dengan mengedit configmap metrics-server-config di namespace gke-managed-metrics-server, dan mengubah nilai untuk cpuPerNode dan memoryPerNode.

kubectl edit cm metrics-server-config -n gke-managed-metrics-server

Contoh konten ConfigMap adalah:

apiVersion: v1
data:
  NannyConfiguration: |-
    apiVersion: nannyconfig/v1alpha1
    kind: NannyConfiguration
    cpuPerNode: 3m
    memoryPerNode: 20Mi
kind: ConfigMap

Setelah memperbarui ConfigMap, buat ulang pod metrics-server dengan perintah berikut:

kubectl delete pod -l k8s-app=metrics-server -n gke-managed-metrics-server

Perutean log dan metrik

Penerus log Stackdriver (stackdriver-log-forwarder) mengirim log dari setiap mesin node ke Cloud Logging. Demikian pula, agen metrik GKE (gke-metrics-agent) mengirim metrik dari setiap mesin node ke Cloud Monitoring. Sebelum log dan metrik dikirim, Operator Stackdriver (stackdriver-operator) melampirkan nilai dari kolom clusterLocation di resource kustom stackdriver ke setiap entri log dan metrik sebelum dirutekan ke Google Cloud. Selain itu, log dan metrik dikaitkan dengan project Google Cloud yang ditentukan dalam spesifikasi resource kustom stackdriver (spec.projectID).

Resource stackdriver mendapatkan nilai untuk kolom clusterLocation dan projectID dari kolom location dan projectID di bagian clusterOperations resource Cluster pada waktu pembuatan cluster.

Semua metrik dan entri log yang dikirim oleh agen stackdriver dirutekan ke endpoint penyerapan global. Selanjutnya, data diteruskan ke endpoint regional Google Cloud terdekat yang dapat dijangkau untuk memastikan keandalan transportasi data.

Setelah endpoint global menerima entri log atau metrik, yang terjadi selanjutnya bergantung pada layanan:

Cara konfigurasi perutean log: saat endpoint logging menerima pesan log, Cloud Logging meneruskan pesan melalui Router Log. Sink dan filter dalam konfigurasi Log Router menentukan cara merutekan pesan. Anda dapat merutekan entri log ke tujuan seperti bucket Logging regional, yang menyimpan entri log, atau ke Pub/Sub. Untuk mengetahui informasi selengkapnya tentang cara kerja perutean log dan cara mengonfigurasinya, lihat Ringkasan perutean dan penyimpanan.

Kolom clusterLocation di resource kustom stackdriver atau kolom clusterOperations.location di spesifikasi Cluster tidak dipertimbangkan dalam proses perutean ini. Untuk log, clusterLocation hanya digunakan untuk memberi label pada entri log, yang dapat berguna untuk memfilter di Logs Explorer.
Cara konfigurasi perutean metrik: saat endpoint metrik menerima entri metrik, entri tersebut akan otomatis dirutekan untuk disimpan di lokasi yang ditentukan oleh metrik. Lokasi dalam metrik berasal dari kolom clusterLocation di resource kustom stackdriver.
Rencanakan konfigurasi Anda: saat Anda mengonfigurasi Cloud Logging dan Cloud Monitoring, konfigurasi Router Log dan tentukan clusterOperations.location yang sesuai dengan lokasi yang paling mendukung kebutuhan Anda. Misalnya, jika Anda ingin log dan metrik masuk ke lokasi yang sama, tetapkan clusterOperations.location ke region yang sama Google Cloud dengan yang digunakan Log Router untuk Google Cloud project Anda.
Perbarui konfigurasi log Anda jika diperlukan: Anda dapat melakukan perubahan kapan saja pada setelan tujuan untuk log karena persyaratan bisnis, seperti rencana pemulihan bencana. Perubahan pada konfigurasi Log Router di Google Cloud akan segera berlaku. Kolom location dan projectID di bagian clusterOperations resource Cluster tidak dapat diubah, sehingga tidak dapat diperbarui setelah Anda membuat cluster. Sebaiknya Anda tidak mengubah nilai di resource stackdriver secara langsung. Resource ini dikembalikan ke status pembuatan cluster awal setiap kali operasi cluster, seperti upgrade, memicu rekonsiliasi.

Persyaratan konfigurasi untuk Logging dan Pemantauan

Ada beberapa persyaratan konfigurasi untuk mengaktifkan Cloud Logging dan Cloud Monitoring dengan Google Distributed Cloud. Langkah-langkah ini disertakan dalam Mengonfigurasi akun layanan untuk digunakan dengan Logging dan Monitoring di halaman Mengaktifkan layanan Google, dan dalam daftar berikut:

Ruang Kerja Cloud Monitoring harus dibuat dalam projectGoogle Cloud . Hal ini dilakukan dengan mengklik Monitoring di konsolGoogle Cloud dan mengikuti alur kerja.
Anda harus mengaktifkan Stackdriver API berikut:
Anda perlu menetapkan peran IAM berikut ke akun layanan yang digunakan oleh agen Stackdriver:
- logging.logWriter
- monitoring.metricWriter
- stackdriver.resourceMetadata.writer
- monitoring.dashboardEditor
- opsconfigmonitoring.resourceMetadata.writer

Tag log

Banyak log Google Distributed Cloud memiliki tag F:

logtag: "F"

Tag ini berarti entri log sudah selesai atau lengkap. Untuk mempelajari lebih lanjut tag ini, lihat Format log dalam proposal desain Kubernetes di GitHub.

Harga

Dalam cluster Google Distributed Cloud, log dan metrik sistem mencakup:

Log dan metrik dari semua komponen dalam cluster admin.
Log dan metrik dari komponen dalam namespace ini di cluster pengguna: kube-system, gke-system, gke-connect, knative-serving, istio-system, monitoring-system, config-management-system, gatekeeper-system, cnrm-system.

Untuk mengetahui informasi selengkapnya, lihat Harga untuk Google Cloud Observability.

Untuk mempelajari kredit untuk metrik Cloud Logging, hubungi tim penjualan untuk mengetahui harga.