Load-Balancing und Skalierung

Google Cloud ermöglicht Load-Balancing und Autoscaling für Instanzgruppen.

Load-Balancing

Google Cloud bietet ein serverseitiges Load-Balancing, sodass Sie eingehenden Traffic auf mehrere VM-Instanzen verteilen können. Das Load-Balancing hat folgende Vorteile:

  • Skalierung der Anwendung
  • Unterstützung bei starkem Traffic
  • Erkennen und automatisches Entfernen fehlerhafter VM-Instanzen durch Systemdiagnosen (wieder fehlerfreie Instanzen werden automatisch wieder hinzugefügt)
  • Leiten des Traffics auf die nächstgelegene Virtuelle Maschine

Google Cloud Load Balancing nutzt die Ressourcen der Weiterleitungsregeln, um bestimmte Arten von Traffic zu verarbeiten und an einen Load-Balancer weiterzuleiten. Mit einer Weiterleitungsregel kann beispielsweise TCP-Traffic mit dem Zielport 80 und der IP-Adresse 192.0.2.1 verarbeitet und an einen Load-Balancer weitergeleitet werden. Von dort wird der Traffic dann an fehlerfreie VM-Instanzen weitergeleitet.

Google Cloud Load Balancing ist ein verwalteter Dienst, d. h., seine Komponenten sind redundant und hoch verfügbar. Wenn eine Lastenausgleichskomponente ausfällt, wird sie neu gestartet oder automatisch und sofort ersetzt.

Google Cloud bietet verschiedene Arten des Load-Balancing, die sich in den Funktionen, Nutzungsszenarien und der Konfigurationsmethode unterscheiden. Beschreibungen finden Sie in der Dokumentation zum Google Cloud-Load-Balancing.

Autoscaling

In Compute Engine können mit Autoscaling bei zu- oder abnehmender Arbeitslast automatisch VM-Instanzen in eine verwaltete Instanzgruppe eingefügt oder daraus entfernt werden. Mit Autoscaling können Ihre Anwendungen Traffic-Anstiege ordnungsgemäß bewältigen. Außerdem senkt es die Kosten in Zeiten eines geringeren Ressourcenbedarfs. Die automatische Skalierung erfolgt nach dem Festlegen der Autoscaling-Richtlinie und anhand der gemessenen Arbeitslast.

Autoscaling-Richtlinie

Wenn Sie Autoscaling nutzen möchten, müssen Sie mindestens ein Autoscaling-Signal festlegen. Jedes Signal kann auf der CPU-Auslastung, der Bereitstellungskapazität des Load-Balancings, den Cloud Monitoring-Messwerten oder Zeitplänen basieren. Wenn Sie eine Autoscaling-Richtlinie mit mehreren Signalen verwenden, wird die Instanzgruppe anhand des Signals skaliert, das die größte Anzahl von VM-Instanzen in der Gruppe abdeckt.

In den folgenden Abschnitten finden Sie eine allgemeine Erläuterung der Autoscaling-Signale. Weitere Informationen zum Einrichten eines bestimmten Autoscaling-Signals finden Sie in der Dokumentation zum entsprechenden Signal.

CPU-Auslastung

Die CPU-Auslastung ist das einfachste Autoscaling, das Sie ausführen können. Mit dieser Richtlinie wird die durchschnittliche CPU-Auslastung einer Gruppe von VM-Instanzen überwacht. Zum Aufrechterhalten der gewünschten Auslastung werden Instanzen zur Gruppe hinzugefügt oder daraus entfernt. Dies ist bei CPU-intensiven Konfigurationen nützlich, deren CPU-Auslastung schwanken kann.

Weitere Informationen hierzu finden Sie unter Basierend auf der CPU-Auslastung skalieren.

Bereitstellungskapazität des Load-Balancing

Wenn Sie ein Autoscaling einrichten, das auf der Load-Balancing-Bereitstellungskapazität basiert, wird die Bereitstellungskapazität einer Instanzgruppe überwacht und entsprechend skaliert, wenn die VM-Instanzen die Kapazität über- oder unterschreiten.

Die Bereitstellungskapazität einer Instanz kann beim Back-End-Dienst des Load-Balancers festgelegt werden und entweder auf der Nutzung oder den Anfragen pro Sekunde basieren.

Weitere Informationen finden Sie unter Basierend auf der Bereitstellungskapazität eines externen HTTP(S)-Load-Balancers skalieren.

Messwertüberwachung

Wenn Sie Cloud Monitoring-Messwerte exportieren oder verwenden, können Sie das Autoscaling so einrichten, dass Daten eines bestimmten Messwerts erfasst werden und die Skalierung anhand des gewünschten Auslastungsgrads erfolgt. Sie können basierend auf den von Monitoring bereitgestellten Standardmesswerten oder auf der Grundlage benutzerdefinierter Messwerte skalieren.

Weitere Informationen finden Sie unter Basierend auf Stackdriver Monitoring-Messwerten skalieren.

Zeitpläne

Mit dem zeitplanbasierten Autoscaling lässt sich die Verfügbarkeit von Arbeitslasten verbessern, da die Kapazität anhand der erwarteten Last im Voraus geplant werden kann. Sie können eine erforderliche Instanzgruppengröße für wiederkehrende Lademuster und einmalige Ereignisse planen.

Weitere Informationen hierzu finden Sie unter Anhand von Zeitplänen skalieren.

Nächste Schritte