Auf dieser Seite wird erläutert, wie Sie die Logging- und Monitoringoptionen verwenden, die für Anthos verfügbar sind, der im Wartemodus ausgeführt wird.
Diese Seite richtet sich an Plattformadministratoren.
Dashboards überwachen
Beispieldashboards für das Monitoring von Cluster- und Knotenmesswerten finden Sie im Anthos Management Center.
Mit der Schaltfläche Grafana Monitoring Dashboard wird die Grafana-Anwendung geöffnet, die im Administratorcluster gehostet wird. Der Grafana-Zugriff wird über das Management Center gesteuert. Wenn Sie im Management Center angemeldet sind, ist keine zusätzliche Anmeldung erforderlich.
Nach der Anmeldung ist eine Liste mit Beispiel-Dashboards verfügbar:
Abfragelogs
Die Schaltfläche Grafana Loki Logs öffnet die Grafana Explorer, in der Logs, einschließlich Kubernetes-Systemlogs, abgefragt werden können. Logs werden mit Labels versehen, wie im folgenden Abschnitt beschrieben.
Loglabels
Logtyp | Labels |
---|---|
Containerlogs |
|
Knoten-Journald-Logs |
|
Audit-Logs |
|
Alle Kubernetes-Labels und das Label Cluster sind als Loglabels enthalten.
Beispielabfragen
Mit der folgenden Abfrage werden Containerlogs ausgewählt:
{cluster="admin", namespace="kube-system", resources="k8s_container", container="kube-apiserver"}
Mit der folgenden Abfrage werden Cluster-Operator-Logs ausgewählt:
{cluster="admin", namespace="kube-system", resources="k8s_container", control_plane="anthos-cluster-operator"}
Der Cluster-Operator ist eine von Anthos auf Bare-Metal bereitgestellte Ressource, mit der Nutzercluster und zugehörige Ressourcen im Administratorcluster verwaltet werden.
Mit der folgenden Abfrage werden Knoten-Journald-Logs ausgewählt:
{cluster="admin", resources="k8s_node"}
Mit der folgenden Abfrage werden Audit-Logs ausgewählt:
{cluster="admin", resources="k8s_audit"}
Mit der folgenden Abfrage werden Bootstrap-Logs für Nutzercluster ausgewählt:
{cluster="admin", namespace="cluster-user-1"}
Der Nutzercluster, der über Bootstrapping verknüpft wird, lautet "user-1".
Management Center-Logs
Mit der folgenden Abfrage werden acm-controller-manager-Logs ausgewählt:
{cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="acm-controller-manager"}
Mit der folgenden Abfrage werden asm-controller-manager-Logs ausgewählt:
{cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="asm-controller-manager"}
Mit der folgenden Abfrage werden bootstrap-service-controller-manager-Logs ausgewählt:
{cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="bootstrap-service-controller-manager"}
Mit der folgenden Abfrage werden billing-controller-manager-Logs ausgewählt:
{cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="billing-controller-manager"}
Mit der folgenden Abfrage werden anthos-admin-controller-manager-Logs ausgewählt:
{cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="anthos-admin-controller-manager"}
Mit der folgenden Abfrage werden iam-controller-manager-Logs ausgewählt:
{cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="iam-controller-manager"}
Benutzerdefinierte StorageClass konfigurieren
Anthos im Wartemodus verwendet PersistentVolumeClaims
, um Speicherplatz zum Speichern von Messwerten, Logs, Dashboards und Benachrichtigungen bereitzustellen. Wenn Sie einen Cluster erstellen, legt der Cluster automatisch eine benutzerdefinierte LogMon
-Ressource an. Um die Standard-StorageClass
zu überschreiben, führen Sie die folgenden Schritte aus:
Führen Sie den folgenden Befehl aus, um Ihre benutzerdefinierte
LogMon
-Ressource in einem Befehlszeileneditor zu öffnen:kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
Aktualisieren Sie in der benutzerdefinierten Ressource
LogMon
denstorageClassName
unter dem Feldspec
:apiVersion: addons.gke.io/v1alpha1 kind: Logmon metadata: # Don't change the name name: logmon-default # Don't change the namespace namespace: kube-system spec: system_logs: outputs: default_loki: deployment: storageClassName: anthos-system # configure the new storage class here system_metrics: outputs: default_prometheus: deployment: storageClassName: anthos-system # configure the new storage class here
Um die Änderungen der benutzerdefinierten Ressource
LogMon
zu speichern, speichern Sie im Befehlszeileneditor und beenden Sie ihn.
Speichergröße konfigurieren
Wenn Sie einen Cluster erstellen, legt der Cluster automatisch eine benutzerdefinierte LogMon
-Ressource an. Um die Speichergröße für Messwerte, Logs, Dashboards und Benachrichtigungen zu überschreiben, führen Sie die folgenden Schritte aus:
Führen Sie den folgenden Befehl aus, um Ihre benutzerdefinierte
LogMon
-Ressource in einem Befehlszeileneditor zu öffnen:kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
Aktualisieren Sie in der benutzerdefinierten Ressource
LogMon
diestorageSize
unter dem Feldspec
:apiVersion: addons.gke.io/v1alpha1 kind: Logmon metadata: # Don't change the name name: logmon-default # Don't change the namespace namespace: kube-system spec: system_logs: outputs: default_loki: deployment: components: loki: storageSize: 20Gi # configure the new storage size for logs here system_metrics: outputs: default_prometheus: deployment: components: alertmanager: storageSize: 1Gi # configure the new storage size for alerts here grafana: storageSize: 1Gi # configure the new storage size for dashboards here prometheus: storageSize: 20Gi # configure the new storage size for metrics here ````
Um die Änderungen der benutzerdefinierten Ressource
LogMon
zu speichern, speichern Sie im Befehlszeileneditor und beenden Sie ihn.
Aufbewahrungsdauer konfigurieren
Um die Aufbewahrungsdauer für Logs in den Prometheus- und Loki-Agents zu konfigurieren, die im Cluster ausgeführt werden, führen Sie die folgenden Schritte aus:
Führen Sie den folgenden Befehl aus, um Ihre benutzerdefinierte
LogMon
-Ressource in einem Befehlszeileneditor zu öffnen:kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
Aktualisieren Sie in der benutzerdefinierten Ressource
LogMon
dieretentionTime
unter dem Feldspec
:apiVersion: addons.gke.io/v1alpha1 kind: Logmon metadata: # Don't change the name name: logmon-default # Don't change the namespace namespace: kube-system spec: system_logs: outputs: default_loki: deployment: retentionPolicy: retentionTime: 720h # configure the new retention time for logs here system_metrics: outputs: default_prometheus: deployment: retentionPolicy: retentionTime: 720h # configure the new retention time for metrics here
Um die Änderungen der benutzerdefinierten Ressource
LogMon
zu speichern, speichern Sie im Befehlszeileneditor und beenden Sie ihn.