Diese Seite wurde von der Cloud Translation API übersetzt.

Logging und Monitoring

Google Distributed Cloud (nur Software) für VMware bietet mehrere Optionen für das Cluster-Logging und -Monitoring, darunter cloudbasierte verwaltete Dienste, Open-Source-Tools und validierte Kompatibilität mit kommerziellen Lösungen von Drittanbietern. In diesem Dokument werden diese Optionen beschrieben. Außerdem erhalten Sie grundlegende Informationen zur Auswahl der richtigen Lösung für Ihre Umgebung.

Optionen für Google Distributed Cloud

Sie haben mehrere Logging- und Monitoring-Optionen für Google Distributed Cloud:

Cloud Logging und Cloud Monitoring
Google Cloud Managed Service for Prometheus (Vorschau)
Validierte Konfigurationen mit Lösungen von Drittanbietern

Cloud Logging und Cloud Monitoring

Google Cloud Observability (ehemals Stackdriver) ist die integrierte Beobachtbarkeitslösung fürGoogle Cloud. Sie bietet eine vollständig verwaltete Logging-Lösung, Messwerterfassung, Monitoring, Dashboards und Benachrichtigungen. Cloud Monitoring überwacht Google Distributed Cloud-Cluster ähnlich wie cloudbasierte GKE-Cluster.

Sie können die clusterinternen Agents für den Umfang des Monitoring und Logging sowie die Ebene der erfassten Messwerte konfigurieren:

Der Umfang des Logging und Monitoring kann nur auf Systemkomponenten (Standardeinstellung) oder auf Systemkomponenten und Anwendungen festgelegt werden
Die Ebene der erfassten Messwerte kann für einen optimierten Satz von Messwerten oder für vollständige Messwerte konfiguriert werden

Weitere Informationen finden Sie in diesem Dokument unter Logging- und Monitoring-Agents für Google Distributed Cloud konfigurieren.

Cloud Logging und Cloud Monitoring sind die ideale Lösung für Kunden, die eine einzige, einfach zu konfigurierende und leistungsstarke cloudbasierte Beobachtbarkeitslösung benötigen. Wir empfehlen dringend Logging und Monitoring, wenn Sie Arbeitslasten nur in der Google Distributed Cloud oder in GKE und der Google Distributed Cloud ausführen. Für Anwendungen mit Komponenten, die in Google Distributed Cloud und in einer herkömmlichen lokalen Infrastruktur ausgeführt werden, sind andere Lösungen für eine End-to-End-Ansicht dieser Anwendungen zu empfehlen.

Weitere Informationen zur Architektur, Konfiguration und dazu, welche Daten standardmäßig für Google Distributed Cloud in Ihrem Google Cloud -Projekt repliziert werden, finden Sie im Abschnitt Funktionsweise von Logging und Monitoring für Google Distributed Cloud.
Weitere Informationen zu Cloud Logging finden Sie in der Dokumentation zu Cloud Logging.
Weitere Informationen zu Cloud Monitoring finden Sie in der Dokumentation zu Cloud Monitoring.

Drittanbieterlösungen

Google hat mit mehreren Logging- und Monitoring-Lösungs-Drittanbietern zusammengearbeitet, damit ihre Produkte mit Google Distributed Cloud kompatibel sind. Dazu gehören Datadog, Elastic und Splunk. Weitere validierte Drittanbieter werden in Zukunft hinzugefügt.

Weitere Informationen zur Verwendung von Drittanbieterlösungen mit Google Distributed Cloud finden Sie unter:

Funktionsweise von Logging und Monitoring für Google Distributed Cloud

Logging- und Monitoring-Agents werden in jedem Cluster installiert und aktiviert, wenn Sie einen neuen Administrator- oder Nutzercluster erstellen. Die Agents erfassen Daten zu Systemkomponenten – der Umfang, den Sie konfigurieren können.

Wenn Sie die erfassten Daten in der Google Cloud Console aufrufen möchten, müssen Sie das Google Cloud Projekt konfigurieren, in dem die Logs und Messwerte gespeichert sind, die Sie ansehen möchten.

Zu den Logging- und Monitoring-Agents in jedem Cluster gehören:

GKE-Messwert-Agent (gke-metrics-agent). Ein DaemonSet, das Messwerte an die Cloud Monitoring API sendet.
Stackdriver Log Forwarder (stackdriver-log-forwarder). Ein Fluent Bit-DaemonSet, das Logs von jeder Maschine an Cloud Logging weiterleitet. Der Log Forwarder puffert die Logeinträge auf dem Knoten lokal und sendet sie bis zu vier Stunden lang noch einmal. Wenn der Zwischenspeicher voll ist oder der Log-Forwarder die Cloud Logging API länger als vier Stunden nicht erreichen kann, werden Logs gelöscht.
Globaler GKE-Messwert-Agent (gke-metrics-agent-global). Ein Deployment, das Messwerte an die Cloud Monitoring API sendet.
Metadata-Agent (stackdriver-metadata-agent). Ein Modul, das Metadaten für Kubernetes-Ressourcen wie Pods, Deployments, Knoten usw. an die Stackdriver Resource Metadata API sendet. Anhand dieser Daten können Sie Messwertabfragen anreichern und Abfragen nach Deployment-Name, Knotenname oder auch Kubernetes-Dienstname ausführen.
kube-state-metrics: Ein Deployment, das den API-Server überwacht und Messwerte zum Status von Objekten generiert.
node-exporter: Ein DaemonSet, das Hardware- und Betriebssystemmesswerte generiert.

Mit dem folgenden Befehl können Sie alle Deployment-Agents aufrufen:

  kubectl --kubeconfig CLUSTER_KUBECONFIG get deployments -l "managed-by=stackdriver" --all-namespaces

Dabei ist CLUSTER_KUBECONFIG der Pfad der kubeconfig-Datei für den Cluster.

Die Ausgabe dieses Befehls sieht so aus:

gke-metrics-agent-global                      1/1     Running   0   4h31m
stackdriver-metadata-agent-cluster-level      1/1     Running   0   4h31m

Mit dem folgenden Befehl können Sie alle DaemonSet-Agents aufrufen:

  kubectl --kubeconfig CLUSTER_KUBECONFIG get daemonsets -l "managed-by=stackdriver" --all-namespaces

Die Ausgabe dieses Befehls sieht so aus:

gke-metrics-agent                             1/1     Running   0   4h31m
stackdriver-log-forwarder                     1/1     Running   0   4h31m

Logging- und Monitoring-Agents für Google Distributed Cloud konfigurieren

Die mit Google Distributed Cloud installierten Agents erfassen abhängig von den Einstellungen und Konfigurationen Daten zu Systemkomponenten, um Probleme mit Ihren Clustern zu warten und zu beheben.

Nur Systemkomponenten (Standardbereich)

Bei der Installation erfassen Agents Logs und Messwerte, einschließlich Leistungsdetails (z. B. CPU- und Speicherauslastung) und ähnliche Metadaten für von Google bereitgestellte Systemkomponenten. Dazu gehören alle Arbeitslasten im Administratorcluster und in Nutzerclustern Arbeitslasten in den Namespaces kube-system, gke-system, gke-connect, istio-system und config-management-system. Sie können die Agents wie in den folgenden Abschnitten beschrieben konfigurieren oder deaktivieren.

Der Umfang der erfassten Logs und Messwerte kann auch um Anwendungen erweitert werden. Anleitungen zum Aktivieren von Anwendungs-Logging und -Monitoring finden Sie unter Logging und Monitoring für Nutzeranwendungen aktivieren.

Optimierte Messwerte (Standardmesswerte)

Standardmäßig erfassen die im Cluster ausgeführten Messwert-Agents einen optimierten Satz von Container-, Kubelet- und Kube State Metrics-Messwerten und melden ihn an Google Cloud Observability (ehemals Stackdriver).

Es sind weniger Ressourcen erforderlich, um diese optimierten Messwerte zu erfassen, was die Gesamtleistung und die Skalierbarkeit verbessert. Dies ist besonders für Messwerte auf Containerebene und auf kube-Ebene wichtig, da die Anzahl der zu überwachenden Objekte sehr groß ist.

Ausgeschlossene Containermesswerte

Die folgenden Containermesswerte sind aus den optimierten Messwerten ausgeschlossen:

container_cpu_cfs_periods_total
container_cpu_cfs_throttled_periods_total
container_cpu_load_average_10s
container_cpu_system_seconds_total
container_cpu_user_seconds_total
container_fs_io_current
container_fs_io_time_seconds_total
container_fs_io_time_weighted_seconds_total
container_fs_read_seconds_total
container_fs_reads_bytes_total
container_fs_reads_merged_total
container_fs_reads_total
container_fs_sector_reads_total
container_fs_sector_writes_total
container_fs_write_seconds_total
container_fs_writes_bytes_total
container_fs_writes_merged_total
container_fs_writes_total
container_last_seen
container_memory_cache
container_memory_failcnt
container_memory_mapped_file
container_memory_max_usage_bytes
container_memory_swap
container_network_receive_packets_dropped_total
container_network_receive_packets_total
container_network_transmit_packets_dropped_total
container_network_transmit_packets_total
container_start_time_seconds
container_spec_cpu_period
container_spec_cpu_quota
container_spec_cpu_shares
container_spec_memory_limit_bytes
container_spec_memory_reservation_limit_bytes
container_spec_memory_swap_limit_bytes
container_start_time_seconds
container_tasks_state

Eine vollständige Liste der Google Distributed Cloud-Messwerte finden Sie unter Google Distributed Cloud-Messwerte.

Ausgeschlossene Kubelet-Messwerte

Die folgenden Kubelet-Messwerte sind von den optimierten Messwerten ausgeschlossen:

kubelet_runtime_operations_duration_seconds
kubelet_runtime_operations_errors
kubelet_runtime_operations_duration_seconds
kubelet_runtime_operations_latency_microseconds
kubelet_runtime_operations_latency_microseconds_count
kubelet_runtime_operations_latency_microseconds_sum
rest_client_request_duration_seconds
rest_client_request_latency_seconds

Eine vollständige Liste der Google Distributed Cloud-Messwerte finden Sie unter Google Distributed Cloud-Messwerte.

Ausgeschlossene Kube-State-Metrics-Messwerte

Die folgenden Kube-State-Metrics-Messwerte sind aus den optimierten Messwerten ausgeschlossen:

kube_certificatesigningrequest_cert_length
kube_certificatesigningrequest_condition
kube_certificatesigningrequest_created
kube_certificatesigningrequest_labels
kube_configmap_annotations
kube_configmap_info
kube_configmap_labels
kube_configmap_metadata_resource_version
kube_daemonset_annotations
kube_daemonset_created
kube_daemonset_labels
kube_daemonset_metadata_generation
kube_daemonset_status_observed_generation
kube_deployment_annotations
kube_deployment_created
kube_deployment_labels
kube_deployment_spec_paused
kube_deployment_spec_strategy_rollingupdate_max_surge
kube_deployment_spec_strategy_rollingupdate_max_unavailable
kube_deployment_status_condition
kube_deployment_status_replicas_ready
kube_endpoint_annotations
kube_endpoint_created
kube_endpoint_info
kube_endpoint_labels
kube_endpoint_ports
kube_horizontalpodautoscaler_annotations
kube_horizontalpodautoscaler_info
kube_horizontalpodautoscaler_labels
kube_horizontalpodautoscaler_metadata_generation
kube_horizontalpodautoscaler_status_condition
kube_job_annotations
kube_job_complete
kube_job_created
kube_job_info
kube_job_labels
kube_job_owner
kube_job_spec_completions
kube_job_spec_parallelism
kube_job_status_completion_time
kube_job_status_start_time
kube_job_status_succeeded
kube_lease_owner
kube_lease_renew_time
kube_limitrange
kube_limitrange_created
kube_mutatingwebhookconfiguration_info
kube_namespace_labels
kube_networkpolicy_annotations
kube_networkpolicy_labels
kube_networkpolicy_spec_egress_rules
kube_networkpolicy_spec_ingress_rules
kube_node_annotations
kube_node_role
kube_persistentvolume_annotations
kube_persistentvolume_labels
kube_persistentvolumeclaim_access_mode
kube_persistentvolumeclaim_annotations
kube_persistentvolumeclaim_labels
kube_pod_annotations
kube_pod_completion_time
kube_pod_container_resource_limits
kube_pod_container_resource_requests
kube_pod_container_state_started
kube_pod_created
kube_pod_init_container_info
kube_pod_init_container_resource_limits
kube_pod_init_container_resource_requests
kube_pod_init_container_status_last_terminated_reason
kube_pod_init_container_status_ready
kube_pod_init_container_status_restarts_total
kube_pod_init_container_status_running
kube_pod_init_container_status_terminated
kube_pod_init_container_status_terminated_reason
kube_pod_init_container_status_waiting
kube_pod_init_container_status_waiting_reason
kube_pod_labels
kube_pod_owner
kube_pod_restart_policy
kube_pod_spec_volumes_persistentvolumeclaims_readonly
kube_pod_start_time
kube_poddisruptionbudget_annotations
kube_poddisruptionbudget_created
kube_poddisruptionbudget_labels
kube_poddisruptionbudget_status_expected_pods
kube_poddisruptionbudget_status_observed_generation
kube_poddisruptionbudget_status_pod_disruptions_allowed
kube_replicaset_annotations
kube_replicaset_created
kube_replicaset_labels
kube_replicaset_metadata_generation
kube_replicaset_owner
kube_replicaset_status_observed_generation
kube_resourcequota_created
kube_secret_annotations
kube_secret_info
kube_secret_labels
kube_secret_metadata_resource_version
kube_secret_type
kube_service_annotations
kube_service_created
kube_service_info
kube_service_labels
kube_service_spec_type
kube_statefulset_annotations
kube_statefulset_created
kube_statefulset_labels
kube_statefulset_status_current_revision
kube_statefulset_status_update_revision
kube_storageclass_annotations
kube_storageclass_created
kube_storageclass_info
kube_storageclass_labels
kube_validatingwebhookconfiguration_info
kube_validatingwebhookconfiguration_metadata_resource_version
kube_volumeattachment_created
kube_volumeattachment_info
kube_volumeattachment_labels
kube_volumeattachment_spec_source_persistentvolume
kube_volumeattachment_status_attached
kube_volumeattachment_status_attachment_metadata

Eine vollständige Liste der Google Distributed Cloud-Messwerte finden Sie unter Google Distributed Cloud-Messwerte.

Wenn Sie optimierte Kube-State-Metrics-Messwerte deaktivieren möchten (nicht empfohlen), setzen Sie das Feld optimizedMetrics in Ihrer benutzerdefinierten Stackdriver-Ressource auf false. Weitere Informationen zum Ändern Ihrer benutzerdefinierten Stackdriver-Ressource finden Sie unter Stackdriver-Komponentenressourcen konfigurieren. Alle Google Distributed Cloud-Messwerte, einschließlich der standardmäßig ausgeschlossenen Messwerte, finden Sie unter Google Distributed Cloud-Messwerte.

Stackdriver aktivieren und deaktivieren

Sie können Logging- und Monitoring-Agents vollständig aktivieren oder deaktivieren. Dazu aktivieren oder deaktivieren Sie die benutzerdefinierte Stackdriver-Ressource. Diese Feature befindet sich im Vorschaumodus.

Bevor Sie die Logging- und Monitoring-Agents deaktivieren, sollten Sie sich auf der Supportseite informieren, wie sich dies auf die SLAs des Google Cloud -Supports auswirkt.

Logging- und Monitoring-Agents erfassen lokal gespeicherte Daten entsprechend Ihrer Speicher- und Aufbewahrungskonfiguration. Die Daten werden in das bei der Installation angegebene Projekt Google Cloudrepliziert. Dazu wird ein Dienstkonto verwendet, das berechtigt ist, Daten in das Projekt zu schreiben. Sie können diese Agents jederzeit deaktivieren, wie zuvor beschrieben.

Sie können auch Daten verwalten und löschen, die von den Logging- und Monitoring-Agents an Cloud Logging und Cloud Monitoring gesendet wurden. Weitere Informationen finden Sie in der Dokumentation zu Cloud Monitoring.

Konfigurationsanforderungen für Logging und Monitoring

Zum Aufrufen von Cloud Logging- und Cloud Monitoring-Daten müssen Sie das Google Cloud -Projekt konfigurieren, in dem die gewünschten Logs und Messwerte gespeichert werden. Dieses Google Cloud Projekt wird als Logging-Monitoring-Projekt bezeichnet.

Aktivieren Sie die folgenden APIs in Ihrem Logging-Monitoring-Projekt:
Weisen Sie Ihrem Logging-Monitoring-Dienstkonto in Ihrem Logging-Monitoring-Projekt die folgenden IAM-Rollen zu.
- logging.logWriter
- monitoring.metricWriter
- stackdriver.resourceMetadata.writer
- monitoring.dashboardEditor
- opsconfigmonitoring.resourceMetadata.writer

Log-Tags

Viele Google Distributed Cloud-Logs haben das Tag F:

logtag: "F"

Dieses Tag bedeutet, dass der Logeintrag vollständig oder vollständig ist. Weitere Informationen zu diesem Tag finden Sie in den Kubernetes-Designvorschlägen auf GitHub unter Log format.

Nächste Schritte

Logging und Monitoring verwenden