Messwerte zur Auslastung von Flottenressourcen

Auf dieser Seite werden die Messwerte für die Flotten- und Teamressourcenauslastung genauer erklärt. Dabei wird erläutert, wie diese Messwerte berechnet werden, und es werden Tipps zur Verwendung dieser Messwerte zur Optimierung der Ressourcennutzung gegeben.

Sie können diese Messwerte in den folgenden Dashboards aufrufen:

Diese Messwerte beschreiben, wie effektiv Ihre Cluster die verfügbaren Ressourcen nutzen, für die Sie bezahlen, oder die Ressourcen, die Sie auf lokaler Hardware zuweisen. Anhand dieser Informationen können Sie die Effektivität der Ressourcennutzung in großem Maßstab auf Flotten- oder Teamebene verstehen. Dies kann Ihnen helfen, entweder die Clustergröße und die Ressourcenzuweisung für Cluster und Namespaces zu optimieren oder die Art und Weise zu optimieren, wie Anwendungsteams Ressourcen anfordern und reservieren.

Messwerte zur Ressourcenauslastung verwenden

Die folgenden Tipps können Ihnen bei der Verwendung der Messwerte in der Console helfen, um Probleme zu identifizieren und zu beheben:

  • Wenn die Gesamt-CPU-/Arbeitsspeicher-/Laufwerksauslastung Ihrer Flotte eine unerwartet hohe oder niedrige Auslastung in den letzten sieben Tagen anzeigt, prüfen Sie auf jeden Fall das Diagramm zur CPU-/Arbeitsspeicher-/Laufwerksauslastung nach Flotte, um zu bewerten, ob die unerwartete Auslastung konstant ist oder durch Nutzungsspitzen verursacht wird.
  • Wenn Top-CPU-/Arbeitsspeicher-/Laufwerksauslastung nach Cluster einzelne Cluster aufzeigt, die sich anders verhalten als der Rest, sollten Sie diese bestimmten Cluster genauer untersuchen. Ziehen Sie in Betracht, die Größe der Cluster nach Möglichkeit anzupassen.
  • Wenn Oberste CPU-/Arbeitsspeicher-/Laufwerksauslastung nach Namespace eine unerwartete Spitze in den letzten sieben Tagen aufweist, sollten Sie prüfen, ob eine bestimmte Arbeitslast die Spitze verursacht. Eine mögliche Lösung besteht darin, Arbeitslasten auf Ressourcen zu verteilen.
  • Mit CPU-/Arbeitsspeicher-/Laufwerksauslastung nach Flotte können Sie das Verhältnis zwischen verwendeten und angeforderten Ressourcen beobachten. Ein großer Unterschied zwischen den beiden kann bedeuten, dass die Anwendungsteams zu viele Ressourcen anfordern und reservieren.

Informationen zu Messwerten zur Ressourcenauslastung

Die folgenden Messwerte werden in den Übersichts-Dashboards zu GKE Enterprise, Flotte und Teambereich bereitgestellt, die anhand von Informationen aus Cloud Monitoring in Ihren Flottenclustern berechnet werden.

Sie können Messwerte auf Flottenebene in den GKE Enterprise- und Flottenübersichts-Dashboards aufrufen. Messwerte auf Teamebene sind in den GKE Enterprise- und Teamübersichts-Dashboards verfügbar.

CPU-Messwerte

  • Gesamte CPU-Auslastung:
    • Bei den Messwerten auf Flottenebene der Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen zuweisbaren und verwendeten Ressourcen in allen Clustern ist, die bei einer Flotte registriert sind.
      • Zuweisbar: Die CPU-Menge, die allen Knoten in allen Clustern zugewiesen ist, die bei einer Flotte registriert sind. Berechnet aus dem Messwert node/cpu/allocatable_cores.
      • Verwendet: Die CPU-Menge, die von allen Containern in allen Clustern verwendet wird, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/cpu/core_usage_time.
    • Für das Team-Dashboard Überwachung der Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen angeforderten und verwendeten Ressourcen in allen Namespaces ist, die einem Teambereich zugeordnet sind.
      • Angefordert: Die CPU-Menge, die von allen Containern in allen Namespaces angefordert wird, die einem Teambereich zugeordnet sind. Berechnet aus dem Messwert container/cpu/request_cores.
      • Verwendet: Die von allen Containern verwendete CPU-Menge in allen Namespaces, die einem Teambereich zugeordnet sind. Berechnet aus dem Messwert container/cpu/core_usage_time.
  • CPU-Auslastung nach Flotte/Team:
    • Für die Flottenebene die Beziehung zwischen genutzten, angeforderten und zugewiesenen Ressourcen.
      • Verwendet: Die CPU-Menge, die von allen Containern in allen Clustern verwendet wird, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/cpu/core_usage_time.
      • Angefordert: Die CPU-Menge, die von allen Containern in allen Clustern angefordert wird, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/cpu/request_cores.
      • Zuweisbar: Die CPU-Menge, die allen Knoten in allen Clustern zugewiesen ist, die bei einer Flotte registriert sind. Berechnet aus dem Messwert node/cpu/allocatable_cores.
    • Für Teamebene die Beziehung zwischen Ressourcenlimit und verwendeten sowie angeforderten Ressourcen.
      • Verwendet: Die von allen Containern verwendete CPU-Menge in allen Namespaces, die einem Teambereich zugeordnet sind. Berechnet aus dem Messwert container/cpu/core_usage_time.
      • Angefordert: Die CPU-Menge, die von allen Containern in allen Namespaces angefordert wird, die einem Teambereich zugeordnet sind. Berechnet aus dem Messwert container/cpu/request_cores.
      • Limit: Die maximale CPU-Menge, die für alle Container in allen Namespaces verfügbar ist, die einem Teambereich zugeordnet sind. Berechnet aus dem Messwert container/cpu/limit_cores.
  • Höchste CPU-Auslastung nach Cluster: Clusterliste, sortiert nach dem Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen zuweisbaren und verwendeten Ressourcen für einen bestimmten Cluster ist.
  • Top-CPU-Auslastung nach Namespace: Namespace-Liste, sortiert nach einem Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen verwendeten und angeforderten Ressourcen für einen bestimmten Namespace ist.
    • Verwendet: Die von allen Containern in einem Namespace verwendete CPU-Menge. Berechnet aus dem Messwert container/cpu/core_usage_time.
    • Angefordert: Die CPU-Menge, die von allen Containern in einem Namespace angefordert wird. Berechnet aus dem Messwert container/cpu/request_cores.

Speichermesswerte

  • Gesamte Arbeitsspeicherauslastung:
    • Bei den Messwerten auf Flottenebene bezieht sich dies auf einen Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen zuweisbaren und verwendeten Ressourcen in allen Clustern ist, die zu einer Flotte gehören.
      • Zuweisbar: Die Arbeitsspeichermenge, die allen Knoten in allen Clustern zugewiesen ist, die bei einer Flotte registriert sind. Berechnet aus dem Messwert node/memory/allocatable_byte.
      • Verwendet: Die Menge des nicht entleerbaren Arbeitsspeichers, der von allen Containern in allen Clustern verwendet wird, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/memory/used_bytes.
    • Für die Messwerte auf Teamebene bezieht sich dies auf den Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster. Der Zeitpunkt ist ein Verhältnis zwischen angeforderten und verwendeten Ressourcen in allen Namespaces, die zu einem Teambereich gehören.
      • Angefordert: Die Arbeitsspeichermenge, die von allen Containern in allen Namespaces angefordert wurde, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/memory/request_bytes.
      • Verwendet: Die Menge des nicht entleerbaren Arbeitsspeichers, der von allen Containern in allen Namespaces verwendet wird, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/memory/used_bytes.
  • Arbeitsspeicherauslastung nach Flotte/Team:
    • Für die Flottenebene die Beziehung zwischen genutzten, angeforderten und zugewiesenen Ressourcen.
      • Verwendet: Die Menge des nicht entleerbaren Arbeitsspeichers, der von allen Containern in allen Clustern verwendet wird, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/memory/used_bytes.
      • Angefordert: Die von allen Containern in allen Clustern angeforderte Arbeitsspeichermenge, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/memory/request_bytes.
      • Zuweisbar: Die Arbeitsspeichermenge, die allen Knoten in allen Clustern zugewiesen ist, die bei einer Flotte registriert sind. Berechnet aus dem Messwert node/memory/allocatable_byte.
    • Für Teamebene die Beziehung zwischen Ressourcenlimit und verwendeten sowie angeforderten Ressourcen.
      • Verwendet: Die Menge des nicht entleerbaren Arbeitsspeichers, der von allen Containern in allen Namespaces verwendet wird, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/memory/used_bytes.
      • Angefordert: Die Arbeitsspeichermenge, die von allen Containern in allen Namespaces angefordert wurde, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/memory/request_bytes.
      • Limit: Die maximale Speichermenge, die für alle Container in allen Namespaces verfügbar ist, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/memory/limit_bytes.
  • Höchste Speicherauslastung nach Cluster: Clusterliste, sortiert nach dem Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen zuweisbaren und verwendeten Ressourcen für einen bestimmten Cluster ist.
    • Zuweisbar: Die Menge an Arbeitsspeicher, die allen Knoten in einem Clusters zugewiesen ist. Berechnet aus dem Messwert node/memory/allocatable_byte.
    • Verwendet: Die Menge des nicht entfernbaren Arbeitsspeichers, der von allen Containern in einem Cluster verwendet wird. Berechnet aus dem Messwert container/memory/used_bytes.
  • Top-Speicherauslastung nach Namespace: Namespace-Liste, sortiert nach einem Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen verwendeten und angeforderten Ressourcen für einen bestimmten Namespace ist.
    • Verwendet: Die Menge des nicht entleerbaren Arbeitsspeichers, der von allen Containern in einem Namespace verwendet wird. Berechnet aus dem Messwert container/memory/used_bytes.
    • Angefordert: Die von allen Containern in einem Namespace angeforderte Arbeitsspeichermenge. Berechnet aus dem Messwert container/memory/request_bytes.

Laufwerkmesswerte

  • Gesamte Laufwerksauslastung:
    • Bei den Messwerten auf Flottenebene bezieht sich dies auf einen Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen zuweisbaren und verwendeten Ressourcen in allen Clustern ist, die zu einer Flotte gehören.
      • Zuweisbar: Die Menge des lokalen sitzungsspezifischen Speichers, der allen Knoten in allen Clustern zugewiesen ist, die bei einer Flotte registriert sind. Berechnet aus dem Messwert node/ephemeral_storage/allocatable_bytes.
      • Verwendet: Die Menge des lokalen sitzungsspezifischen Speichers, der von allen Containern in allen Clustern verwendet wurde, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/ephemeral_storage/used_bytes.
    • Für die Messwerte auf Teamebene bezieht sich dies auf den Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster. Der Zeitpunkt ist ein Verhältnis zwischen angeforderten und verwendeten Ressourcen in allen Namespaces, die zu einem Teambereich gehören.
      • Angefordert: Die Menge des lokalen sitzungsspezifischen Speichers, die von allen Containern in allen Namespaces angefordert wurde, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/ephemeral_storage/request_bytes.
      • Verwendet: Die Menge des lokalen sitzungsspezifischen Speichers, der von allen Containern in allen Namespaces verwendet wurde, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/ephemeral_storage/used_bytes.
  • Laufwerksauslastung nach Flotte/Team:
    • Für die Flottenebene die Beziehung zwischen genutzten, angeforderten und zugewiesenen Ressourcen.
      • Verwendet: Die Menge des lokalen sitzungsspezifischen Speichers, der von allen Containern in allen Clustern verwendet wurde, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/ephemeral_storage/used_bytes.
      • Angefordert: Die Menge des lokalen sitzungsspezifischen Speichers, die von allen Containern in allen Clustern angefordert wird, die bei einer Flotte registriert sind. Berechnet aus dem Messwert container/ephemeral_storage/request_bytes.
      • Zuweisbar: Die Menge des lokalen sitzungsspezifischen Speichers, der allen Knoten in allen Clustern zugewiesen ist, die bei einer Flotte registriert sind. Berechnet aus dem Messwert node/ephemeral_storage/allocatable_bytes.
    • Für Teamebene die Beziehung zwischen Ressourcenlimit und verwendeten sowie angeforderten Ressourcen.
      • Verwendet: Die Menge des lokalen sitzungsspezifischen Speichers, der von allen Containern in allen Namespaces verwendet wurde, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/ephemeral_storage/used_bytes.
      • Angefordert: Die Menge des lokalen sitzungsspezifischen Speichers, die von allen Containern in allen Namespaces angefordert wurde, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/ephemeral_storage/request_bytes.
      • Limit: Die maximale Menge lokalen sitzungsspezifischen Speichers, die für alle Container in allen Namespaces verfügbar ist, die einem Bereich zugeordnet sind. Berechnet aus dem Messwert container/ephemeral_storage/limit_bytes.
  • Höchste Laufwerksauslastung nach Cluster: Clusterliste, sortiert nach dem Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen zuweisbaren und verwendeten Ressourcen für einen bestimmten Cluster ist.
  • Top-Laufwerksauslastung nach Namespace: Namespace-Liste, sortiert nach einem Durchschnitt aller Zeitpunkte für ein bestimmtes Zeitfenster, wobei der Zeitpunkt ein Verhältnis zwischen verwendeten und angeforderten Ressourcen für einen bestimmten Namespace ist.

Fehlerverteilung nach Namespace (nur Teamebene)

Namespace-Liste, sortiert nach der höchsten Anzahl an Fehlerlogs für ein bestimmtes Zeitfenster. Logs werden von Cloud Logging erfasst.

Verteilung der Neustarts nach Namespace (nur Teamebene)

Namespace-Liste, sortiert nach der höchsten Anzahl an Containerneustarts für ein bestimmtes Zeitfenster. Berechnet aus dem Messwert container/restart_count.

Fehlerbehebung

Messwerte werden für neue Cluster nicht geladen

Wenn Sie neue Cluster erstellt haben, wird je nach ausgewähltem Zeitfenster möglicherweise No Data im gesamten Monitoring-Dashboard angezeigt oder Sie sehen Messwerte. Wenn Sie beispielsweise einen Cluster innerhalb der letzten Stunde erstellt haben und ein Zeitfenster von 1 Stunde oder 6 Stunden auswählen, gibt das Dashboard möglicherweise einige Messwerte für Ihre Arbeitslasten zurück. Wenn Sie jedoch ein Zeitfenster von 1 Tag oder mehr auswählen, wird möglicherweise No data im gesamten Dashboard angezeigt.

Dies liegt daran, dass Cloud Monitoring Daten in verschiedenen Zeiträumen (Intervallen) für unterschiedliche Zeitfenster erfasst. Für Zeitfenster von 1 Stunde und 6 Stunden werden die Daten in 1-Minuten-Zeiträumen erfasst. Wenn Ihr Cluster also einige Minuten lang existiert hat, werden Messwerte für diese Zeitfenster angezeigt.

Für Zeitfenster von 1 Tag und 1 Woche erfasst Cloud Monitoring Daten in 1-Stunden-Zeiträumen. Wenn der Cluster weniger als eine Stunde vorhanden war, werden für solche Zeitfenster möglicherweise keine Daten angezeigt.

Wenn dieser Fehler auftritt, prüfen Sie das Dashboard, nachdem mehr Zeit seit dem Erstellen des neuen Clusters verstrichen ist.