Autoscaling für Knotengruppen

Diese Seite bietet einen Überblick über das Autoscaling für Knotengruppen. Eine Anleitung zur Verwendung des Autoscalings für Knotengruppen finden Sie unter Autoscaling für Knotengruppen.

Mit dem Autoscaling für Knotengruppen können Sie die Größen Ihrer Knotengruppen für einzelne Mandanten automatisch verwalten:

  • Die Größe einer Knotengruppe wird vergrößert, wenn die Kapazität für eine andere VM-Instanz in dieser Knotengruppe nicht ausreicht. Nachdem die Knotengruppe durch Autoscaling vergrößert wurde, werden die VMs transparent geplant.

  • Die Größe einer Knotengruppe wird verringert, wenn leere Knoten vorhanden sind. Somit müssen Sie für nicht verwendete Knoten für einzelne Mandanten nichts bezahlen.

Autoscaling-Modi

Standardmäßig ist das Autoscaling für Knotengruppen nicht aktiviert. Wenn das Autoscaling nicht aktiviert ist, müssen Sie die Größen Ihrer Knotengruppen manuell verwalten. Beim Aktivieren des Autoscalings für eine Knotengruppe können Sie angeben, ob das Autoscaling die Knotengruppe sowohl vergrößern als auch verringern (hoch- und herunterskalieren) oder nur die Größe der Gruppe vergrößern (nur hochskalieren) soll.

Hoch- und herunterskalieren

In diesem Modus wird das Autoscaling der Knotengruppe sowohl vergrößert als auch verkleinert. Bei diesem Modus müssen Sie eine Maximal- und Mindestgröße für die Knotengruppe angeben. Das Autoscaling skaliert die Größe der Knotengruppe nicht über den angegebenen Höchstwert oder unter den angegebenen Mindestwert.

Das Autoscaling skaliert die Größe einer Knotengruppe hoch, wenn eine Anfrage zum Planen einer VM für eine Knotengruppe eingeht, die keine Kapazität für eine weitere VM hat. Umgekehrt skaliert das Autoscaling die Größe einer Knotengruppe herunter, wenn die Knotengruppe einen leeren Knoten enthält.

Nur hochskalieren

In diesem Modus erhöht das Autoscaling als Reaktion auf Anfragen zum Planen von VMs die Größe der Knotengruppe, leere Knoten werden jedoch nicht aus den Knotengruppen entfernt. Google empfiehlt diesen Modus für kontinuierlich zunehmende Arbeitslasten oder Arbeitslasten, die eine physische Serveraffinität erfordern, beispielsweise BYOL-Arbeitslasten, für die sich Lizenzen auf demselben physischen Server befinden müssen.

Dieser Modus ist erforderlich, wenn Ihre Knotengruppen so konfiguriert sind, dass ihre gehosteten VMs auf einer Mindestanzahl von Servern neu gestartet werden.

Größenbereich einer Knotengruppe

Beim Aktivieren des Autoscalings legen Sie den Größenbereich der Knotengruppe fest, indem Sie einen Mindest- und Höchstwert für die Größe der Knotengruppe angeben.

Wenn Sie keinen Wert für die Mindestgröße angeben, setzt das Autoscaling die Mindestgröße auf null (0). Wenn Sie einen Wert für die Mindestgröße angeben, muss dieser eine Ganzzahl größer als 0 und kleiner oder gleich der Maximalgröße sein.

Sie müssen einen Wert für die maximale Größe der Knotengruppe angeben. Der Wert muss eine Ganzzahl größer oder gleich 0 und kleiner oder gleich 100 sein. Dies ist die maximal zulässige Größe für eine Knotengruppe für einzelne Mandanten. Der Wert muss größer oder gleich dem angegebenen Mindestwert sein.

Erstellen Sie mehrere Knotengruppen mit übereinstimmenden Affinitätslabels, z. B. workload:in:my-autoscaled-node-groups, um Arbeitslasten zu berücksichtigen, die möglicherweise den Höchstwert von 100 für eine Knotengruppe überschreiten. Planen Sie anschließend VMs mit diesem Affinitätslabel und aktivieren Sie das Autoscaling für jede Gruppe, um Knotengruppen mit dynamischer Skalierung zu erstellen.

Verfügbarkeit

Sie können das Autoscaling für Knoten für einzelne Mandanten nur in Regionen verwenden, die Knoten für einzelne Mandanten unterstützen.

Nächste Schritte