Limits für die VM-Laufzeit in Google Distributed Cloud

Auf dieser Seite finden Sie grundlegende Informationen zur Skalierung von VMs, die in GKE on Bare Metal ausgeführt werden. Die bereitgestellten Informationen geben keine festen Grenzwerte oder garantierten Grenzwerte für das Produkt oder Ihre Installation an. Die Informationen sollen Ihnen helfen festzustellen, ob die VM-Laufzeit in Google Distributed Cloud Ihre Computing-Anforderungen erfüllen kann.

Informationen zu Kontingenten, Limits und der Skalierung für GKE on Bare Metal finden Sie unter Kontingente und Limits.

Maximale VM-Skalierung

Wir haben durch umfangreiche Tests festgestellt, dass Sie zuverlässig bis zu 500 VMs gleichzeitig in einem GKE-Cluster mit 50 Knoten ausführen können.

Ressourcennutzung

Sorgen Sie zum Hochskalieren von VM-Bereitstellungen dafür, dass im Cluster genügend CPU-, Arbeitsspeicher- und Speicherressourcen für VMs und die Komponenten der Steuerungsebene vorhanden sind. Die Standardressourcenanforderungen für Clusterknotenmaschinen finden Sie unter Voraussetzungen für Clusterknotenmaschinen.

Beachten Sie die folgende VM-Laufzeit in Google Distributed Cloud-Ressourcennutzung für unsere Konfiguration für die maximale VM-Skalierung:

  • Die gesamte CPU-Freigabe, die von allen Komponenten im Namespace vm-system verwendet wird, liegt bei ungefähr 1.3 bei der Spitzenauslastung.
  • Der Gesamtarbeitsspeicher, der von allen Komponenten im vm-system-Namespace belegt wird, beträgt ungefähr 10 GiB.

Bekanntes Ressourcenproblem

Wenn der Gast-Agent aktiviert ist, registriert derzeit jede VM einen separaten Watcher auf dem API-Server. Daher steigt die Anzahl der registrierten Watcher in kube-apiserver linear mit der Anzahl der VMs. Abhängig von den ausgeführten Arbeitslasten können mit der Anzahl der VMs Probleme im Zusammenhang mit kube-apiserver auftreten. Wenn Sie von diesem Problem betroffen sind, können Sie kube-apiserver konfigurieren oder den Gast-Agent deaktivieren, wenn Sie ihn nicht verwenden.