Auf dieser Seite wird erläutert, wie Sie unter- und überprovisionierte Google Kubernetes Engine-Cluster (GKE) erkennen. GKE bietet Statistiken und Empfehlungen für Szenarien zur Kostenoptimierung, z. B. für überdimensionierte und inaktive Cluster, sowie für Szenarien zur Verbesserung der Zuverlässigkeit, z. B. für unterdimensionierte Cluster. GKE bietet entsprechende Empfehlungen zum Skalieren, Verkleinern oder Löschen der Cluster. Informationen zu inaktiven Clustern finden Sie unter Inaktive GKE-Cluster identifizieren.
Nachdem Sie überprüft haben, ob die identifizierten Cluster von der Empfehlung zum Skalieren profitieren würden, können Sie die empfohlene Änderung vornehmen, um Kosten zu sparen oder die Zuverlässigkeit Ihres Clusters zu erhöhen. Sofern möglich, enthält die Empfehlung prognostizierte monatliche Einsparungen oder Kosten. Weitere Informationen finden Sie unter Kosten- oder Einsparungsschätzungen verstehen.
GKE bietet diese Statistiken nicht für Autopilot-Cluster, da diese nur minimale Betriebskosten verursachen, da Sie nur für die Ressourcen bezahlen, die von Ihren Arbeitslasten angefordert werden. Weitere Informationen finden Sie unter Autopilot-Preise.
GKE überwacht Ihre Cluster und liefert Ihnen mit Active Assist Hinweise dazu, wie Sie Ihre Nutzung optimieren können. Dieser Dienst bietet Recommender, die Statistiken und Empfehlungen zur Verwendung von Ressourcen in Google Cloudgenerieren. Weitere Informationen zum Verwalten von Statistiken und Empfehlungen finden Sie unter Nutzung von GKE mit Statistiken und Empfehlungen optimieren.
Statistiken und Empfehlungen für Cluster mit zu wenig oder zu viel Kapazität erhalten
GKE stellt diese Statistiken und Empfehlungen an den folgenden Stellen in der Google Cloud Console bereit:
- Auf der Seite Kubernetes-Cluster an den folgenden Stellen:
- In der Liste Kubernetes-Cluster in der Spalte Benachrichtigungen für die entsprechenden Cluster
- Benachrichtigungsbanner auf der Seite Cluster für einen bestimmten Cluster
- FinOps-Hub
Die Empfehlungen haben auf der Seite Kubernetes-Cluster die folgenden Titel:
- Überprovisionierte Cluster: „Clusterressourcen zur Kostensenkung verringern“
- Cluster mit zu wenig Ressourcen: „Erhöhen Sie die Clusterressourcen, um die Zuverlässigkeit zu verbessern“
Sie können diese Statistiken und Empfehlungen auch über die Google Cloud CLI oder die Recommender API mit den Untertypen CLUSTER_UNDERPROVISIONED
und CLUSTER_OVERPROVISIONED
abrufen.
Folgen Sie der Anleitung zum Aufrufen von Statistiken und Empfehlungen.
Wenn Sie Cluster mit zu wenig oder zu viel Ressourcen gefunden haben, lesen Sie den Hilfeartikel Clustergröße anpassen.
So identifiziert GKE unter- und überprovisionierte Cluster
In der folgenden Tabelle werden die Signale beschrieben, die GKE zum Identifizieren von unter- und überprovisionierten Clustern verwendet, die skaliert werden können, und der Schwellenwert für jedes Signal. Außerdem wird in dieser Tabelle die Maßnahme aufgeführt, die wir in diesem Szenario empfehlen.
Subtyp | Signal | Beobachtungszeitraum | Details | Empfehlung |
---|---|---|---|---|
CLUSTER_UNDERPROVISIONED |
Hohe CPU- oder Arbeitsspeicherauslastung | Letzte 30 Tage | Ein GKE-Cluster ist unterdimensioniert, wenn sowohl die CPU- als auch die Arbeitsspeicherauslastung in den letzten 30 Tagen durchschnittlich jede Stunde über 80% lag. | Cluster skalieren, um die Zuverlässigkeit zu erhöhen |
CLUSTER_OVERPROVISIONED |
CPU- und Arbeitsspeichernutzung ist niedrig | Letzte 30 Tage | Ein GKE-Cluster ist überdimensioniert, wenn die CPU- und Arbeitsspeicherauslastung in den letzten 30 Tagen durchschnittlich zwischen 7% und 20% pro Stunde betrug. | Cluster verkleinern, um Kosten zu sparen |
GKE sendet keine Empfehlungen für Cluster, die vor weniger als 30 Tagen erstellt wurden.
Kosten- oder Einsparungsschätzungen
Sofern möglich, enthält die GKE-Empfehlung eine Schätzung der monatlichen Kosten oder Einsparungen, die sich durch die richtige Clustergröße ergeben. Diese Schätzung ergibt sich aus den Clusterkosten der letzten 30 Tage.
Geschätzte Kosten oder Einsparungen sind Prognosen, die auf früheren Ausgaben basieren. Sie sind keine Garantie für zukünftige Kosten oder Einsparungen.
Damit Sie diese Schätzungen sehen können, benötigen Sie die erforderliche Berechtigung billing.accounts.getSpendingInformation
, um Ausgabeninformationen abzurufen. Weitere Informationen finden Sie unter Cloud Billing-Zugriff.
Weitere Informationen zu den Kosten all Ihrer GKE-Cluster, einschließlich einer detaillierteren Aufschlüsselung nach Namespaces und Arbeitslasten, finden Sie unter Wichtige Informationen zu Ausgaben für die GKE-Ressourcenzuweisung und Clusterkosten abrufen.
Weitere Informationen zu den Kosten für den Betrieb eines GKE-Clusters finden Sie unter GKE-Preise.
Überlegungen zur richtigen Größe von Clustern
Bevor Sie einer Empfehlung zum Skalieren eines Clusters folgen, sollten Sie Folgendes berücksichtigen:
- Prüfen Sie die Ressourcenauslastung der Anwendungen, die in Ihrem Cluster ausgeführt werden, um die Leistung zu ermitteln und festzustellen, ob sie mehr oder weniger CPU und Arbeitsspeicher als erwartet beanspruchen. Eine Anleitung finden Sie unter Ressourcenanfragen analysieren.
- Bei Batchverarbeitungslasten wird die Clusterressourcenauslastung möglicherweise absichtlich hoch gehalten, um Kosten zu sparen. Wenn die zugewiesenen Clusterressourcen für die im Cluster ausgeführten Batchjobs ausreichen, müssen Sie den stark ausgelasteten Cluster, der als unterversorgt eingestuft wurde, nicht skalieren.
Empfehlung zur richtigen Größe eines Clusters umsetzen
Im Folgenden erfahren Sie, wie Sie die Größe eines Clusters an Ihre Ressourcennutzung anpassen können.
Unterdimensionierten Cluster skalieren
Um das Risiko von Zuverlässigkeitsproblemen zu minimieren, indem Sie die Größe eines unterdimensionierten Clusters anpassen, erhöhen Sie die Ressourcen im Cluster. Sie haben dazu folgende Möglichkeiten:
- Aktivieren Sie den Cluster Autoscaler und die automatische Knotenbereitstellung oder passen Sie die Einstellungen so an, dass eine größere Skalierung möglich ist.
- Sie können Ihren Cluster horizontal skalieren, indem Sie die Anzahl der Knoten erhöhen. Folgen Sie der Anleitung unter Horizontal skalieren, indem Sie die Knotenzahl ändern.
- Wählen Sie einen größeren Maschinentyp für Ihre Knotenpools aus. Folgen Sie der Anleitung unter Vertikale Skalierung durch Änderung der Knotenmaschinenattribute.
- Sie können die CPU- und Arbeitsspeichernutzung von Anwendungen, die in Ihrem Cluster ausgeführt werden, überwachen und prüfen. Sehen Sie nach, ob Sie Anwendungen verkleinern können. Eine Anleitung zum Überwachen der Ressourcennutzung finden Sie unter Ressourcenanfragen analysieren.
Wenn Sie diese Empfehlung umsetzen, sorgen Sie dafür, dass Ihr Cluster zuverlässig bleibt, da er über die richtige Anzahl von Ressourcen für seine Anwendungen verfügt.
Größe eines überdimensionierten Clusters anpassen
Wenn Sie die Empfehlung zur Kosteneinsparung durch die Größenanpassung eines überprovisionierten Clusters umsetzen möchten, verringern Sie die Ressourcen im Cluster. Passen Sie die CPU- und Arbeitsspeicherzuweisungen des Clusters an Ihre Arbeitslastanforderungen an. Sie haben dazu folgende Möglichkeiten:
- Passen Sie Cluster Autoscaler und automatische Knotenbereitstellung an, um nicht ausgelastete Ressourcen stärker herunterzuskalieren.
- Sie können Ihren Cluster horizontal skalieren, indem Sie die Anzahl der Knoten verringern. Folgen Sie der Anleitung unter Horizontal skalieren, indem Sie die Knotenzahl ändern.
- Wählen Sie einen kleineren Maschinentyp für Ihre Knotenpools aus. Folgen Sie der Anleitung unter Vertikale Skalierung durch Änderung der Knotenmaschinenattribute.
- Sie können die CPU- und Arbeitsspeichernutzung von Anwendungen, die in Ihrem Cluster ausgeführt werden, überwachen und prüfen. Prüfen Sie, ob Sie Anwendungen skalieren können. Eine Anleitung zum Überwachen der Ressourcennutzung finden Sie unter Ressourcenanfragen analysieren.
Wenn Sie diese Empfehlung umsetzen, sorgen Sie dafür, dass Sie nicht mehr Ressourcen als zum Ausführen der Anwendungen Ihres Clusters erforderlich sind, verbrauchen.
Nächste Schritte
- Kostenbezogene Optimierungsmesswerte ansehen
- Kostensenkung durch Herunterskalieren von GKE-Clustern außerhalb der Spitzenzeiten
- Nutzung von GKE mit Statistiken und Empfehlungen optimieren
- Best Practices zum Ausführen kostenoptimierter Kubernetes-Anwendungen in GKE
- 5 GKE-Funktionen zur Optimierung Ihrer Cluster