Load-Balancing und Skalierung

Die Google Cloud Platform (GCP) ermöglicht Load-Balancing und Autoscaling für Gruppen von Instanzen.

Load-Balancing

Die GCP bietet ein serverseitiges Load-Balancing, sodass Sie eingehenden Traffic auf mehrere VM-Instanzen verteilen können. Das Load-Balancing hat folgende Vorteile:

  • Skalierung der Anwendung
  • Unterstützung bei starkem Traffic
  • Erkennen und automatisches Entfernen fehlerhafter VM-Instanzen durch Systemdiagnosen (wieder fehlerfreie Instanzen werden automatisch wieder hinzugefügt)
  • Weiterleiten des Traffics auf die nächstgelegene virtuelle Maschine

Das GCP-Load-Balancing nutzt die Ressourcen der Weiterleitungsregeln, um bestimmte Arten von Traffic zu verarbeiten und sie an einen Load-Balancer weiterzuleiten. Mit einer Weiterleitungsregel kann beispielsweise TCP-Traffic mit dem Zielport 80 und der IP-Adresse 192.0.2.1 verarbeitet und an einen Load-Balancer weitergeleitet werden. Von dort wird der Traffic dann an fehlerfreie VM-Instanzen weitergeleitet.

Das GCP-Load-Balancing ist ein verwalteter Dienst, d. h., seine Komponenten sind redundant und hoch verfügbar. Wenn eine Load-Balancing-Komponente ausfällt, wird sie sofort automatisch neu gestartet oder ersetzt.

GCP bietet verschiedene Arten des Load-Balancing, die sich in den Funktionen, Nutzungsszenarien und der Konfigurationsmethode unterscheiden. Beschreibungen finden Sie in der Dokumentation zum Google Cloud-Load-Balancing.

Autoscaling

In Compute Engine könnten mit Autoscaling bei zu- oder abnehmender Arbeitslast automatisch VM-Instanzen zu einer Instanzgruppe hinzugefügt oder daraus entfernt werden. Mit Autoscaling können Ihre Anwendungen Traffic-Anstiege ordnungsgemäß bewältigen. Außerdem senkt es die Kosten in Zeiten eines geringeren Ressourcenbedarfs. Die automatische Skalierung erfolgt nach dem Festlegen der Autoscaling-Richtlinie und anhand der gemessenen Arbeitslast.

Richtlinien

Wenn Sie Autoscaling nutzen möchten, müssen Sie mindestens eine Autoscaling-Richtlinie festlegen. Die Richtlinie kann auf der CPU-Auslastung, der Load-Balancing-Bereitstellungskapazität oder den Stackdriver Monitoring-Messwerten basieren. Wenn Sie mehrere Richtlinien verwenden, wird die Instanzgruppe anhand der Richtlinie skaliert, die die größte Anzahl von VM-Instanzen in der Gruppe abdeckt.

In den folgenden Abschnitten finden Sie eine allgemeine Erläuterung der Autoscaling-Richtlinien. Weitere Informationen zum Einrichten einer speziellen Autoscaling-Richtlinie erhalten Sie in der Dokumentation zur jeweiligen Richtlinie.

CPU-Auslastung

Die CPU-Auslastung ist das einfachste Autoscaling, das Sie ausführen können. Mit dieser Richtlinie wird die durchschnittliche CPU-Auslastung einer Gruppe von VM-Instanzen überwacht. Zum Aufrechterhalten der gewünschten Auslastung werden Instanzen zur Gruppe hinzugefügt oder daraus entfernt. Dies ist bei CPU-intensiven Konfigurationen nützlich, deren CPU-Auslastung schwanken kann.

Weitere Informationen hierzu finden Sie unter Basierend auf der CPU-Auslastung skalieren.

Bereitstellungskapazität des Load-Balancing

Wenn Sie ein Autoscaling einrichten, das auf der Load-Balancing-Bereitstellungskapazität basiert, wird die Bereitstellungskapazität einer Instanzgruppe überwacht und entsprechend skaliert, wenn die VM-Instanzen die Kapazität über- oder unterschreiten.

Die Bereitstellungskapazität einer Instanz kann beim Back-End-Dienst des Load-Balancers festgelegt werden und entweder auf der Nutzung oder den Anfragen pro Sekunde basieren.

Weitere Informationen finden Sie unter Basierend auf der HTTP(S)-Load-Balancing-Bereitstellungskapazität skalieren.

Messwerte überwachen

Wenn Sie Stackdriver Monitoring-Messwerte exportieren oder verwenden, können Sie das Autoscaling so einrichten, dass Daten eines bestimmten Messwerts erfasst werden und die Skalierung anhand des gewünschten Nutzungsgrads erfolgt. Sie können die für die Skalierung zu verwendenden Standardmesswerte von Stackdriver Monitoring beziehen oder selbst erstellen.

Weitere Informationen finden Sie unter Basierend auf Stackdriver Monitoring-Messwerten skalieren.

Weitere Informationen

Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit:

Feedback geben zu...

Compute Engine-Dokumentation