Load-Balancing und Skalierung


Google Cloud ermöglicht Load-Balancing und Autoscaling für Instanzgruppen.

Load-Balancing

Google Cloud bietet ein serverseitiges Load-Balancing, sodass Sie eingehenden Traffic auf mehrere VM-Instanzen verteilen können. Das Load-Balancing hat folgende Vorteile:

  • Skalierung der Anwendung
  • Unterstützung bei starkem Traffic
  • Erkennen und automatisches Entfernen fehlerhafter VM-Instanzen durch Systemdiagnosen (wieder fehlerfreie Instanzen werden automatisch wieder hinzugefügt)
  • Leiten des Traffics auf die nächstgelegene Virtuelle Maschine

Google Cloud Load Balancing nutzt die Ressourcen der Weiterleitungsregeln, um bestimmte Arten von Traffic zu verarbeiten und an einen Load-Balancer weiterzuleiten. Mit einer Weiterleitungsregel kann beispielsweise TCP-Traffic mit dem Zielport 80 und der IP-Adresse 192.0.2.1 verarbeitet und an einen Load-Balancer weitergeleitet werden. Von dort wird der Traffic dann an fehlerfreie VM-Instanzen weitergeleitet.

Google Cloud Load Balancing ist ein verwalteter Dienst, d. h., seine Komponenten sind redundant und hoch verfügbar. Wenn eine Lastenausgleichskomponente ausfällt, wird sie neu gestartet oder automatisch und sofort ersetzt.

Google Cloud bietet verschiedene Arten des Load-Balancing, die sich in den Funktionen, Nutzungsszenarien und der Konfigurationsmethode unterscheiden. Beschreibungen finden Sie in der Dokumentation zum Google Cloud-Load-Balancing.

Autoscaling

In Compute Engine können mit Autoscaling bei zu- oder abnehmender Arbeitslast automatisch VM-Instanzen in eine verwaltete Instanzgruppe (Managed Instance Group, MIG) eingefügt oder daraus entfernt werden. Mit Autoscaling können Ihre Anwendungen Traffic-Anstiege ordnungsgemäß bewältigen. Außerdem senkt es die Kosten in Zeiten eines geringeren Ressourcenbedarfs. Sie können eine MIG anhand ihrer CPU-Auslastung, der Cloud Monitoring-Messwerte, der Zeitpläne oder der Bereitstellungskapazität des Load-Balancings automatisch skalieren.

Wenn Sie ein Autoscaling einrichten, das auf der Load-Balancing-Bereitstellungskapazität basiert, wird die Bereitstellungskapazität einer Instanzgruppe überwacht und entsprechend skaliert, wenn die VM-Instanzen die Kapazität über- oder unterschreiten. Die Bereitstellungskapazität einer Instanz kann beim Backend-Dienst des Load-Balancers festgelegt werden und entweder auf der Nutzung oder den Anfragen pro Sekunde basieren. Weitere Informationen dazu finden Sie unter Anhand von Load-Balancing-Bereitstellungskapazität skalieren.

Weitere Informationen zum Autoscaling finden Sie unter Autoscaling von Instanzgruppen.

Nächste Schritte