Auf dieser Seite finden Sie grundlegende Informationen zur Skalierung von VMs, die in GKE on Bare Metal ausgeführt werden. Die bereitgestellten Informationen geben keine festen Grenzwerte oder garantierten Grenzwerte für das Produkt oder Ihre Installation an. Die Informationen sollen Ihnen helfen festzustellen, ob die VM-Laufzeit in Google Distributed Cloud Ihre Computing-Anforderungen erfüllen kann.
Informationen zu Kontingenten, Limits und der Skalierung für GKE on Bare Metal finden Sie unter Kontingente und Limits.
Maximale VM-Skalierung
Wir haben durch umfangreiche Tests festgestellt, dass Sie zuverlässig bis zu 500 VMs gleichzeitig in einem GKE-Cluster mit 50 Knoten ausführen können.
Ressourcennutzung
Sorgen Sie zum Hochskalieren von VM-Bereitstellungen dafür, dass im Cluster genügend CPU-, Arbeitsspeicher- und Speicherressourcen für VMs und die Komponenten der Steuerungsebene vorhanden sind. Die Standardressourcenanforderungen für Clusterknotenmaschinen finden Sie unter Voraussetzungen für Clusterknotenmaschinen.
Beachten Sie die folgende VM-Laufzeit in Google Distributed Cloud-Ressourcennutzung für unsere Konfiguration für die maximale VM-Skalierung:
- Die gesamte CPU-Freigabe, die von allen Komponenten im Namespace
vm-system
verwendet wird, liegt bei ungefähr 1.3 bei der Spitzenauslastung. - Der Gesamtarbeitsspeicher, der von allen Komponenten im
vm-system
-Namespace belegt wird, beträgt ungefähr 10 GiB.
Bekanntes Ressourcenproblem
Wenn der Gast-Agent aktiviert ist, registriert derzeit jede VM einen separaten Watcher auf dem API-Server. Daher steigt die Anzahl der registrierten Watcher in kube-apiserver
linear mit der Anzahl der VMs. Abhängig von den ausgeführten Arbeitslasten können mit der Anzahl der VMs Probleme im Zusammenhang mit kube-apiserver
auftreten. Wenn Sie von diesem Problem betroffen sind, können Sie kube-apiserver
konfigurieren oder den Gast-Agent deaktivieren, wenn Sie ihn nicht verwenden.