Load-Balancing und Skalierung

Die Google Cloud Platform (GCP) ermöglicht den Lastenausgleich und die automatische Skalierung für Gruppen von Instanzen.

Lastenausgleich

GCP bietet einen serverseitigen Lastenausgleich, sodass Sie eingehenden Traffic über mehrere VM-Instanzen verteilen können. Der Lastenausgleich hat folgende Vorteile:

  • Skalierung Ihrer Anwendung
  • Unterstützung bei starkem Traffic
  • Erkennen und automatisches Entfernen von fehlerhaften VM-Instanzen mit Systemdiagnosen. Wieder fehlerfreie Instanzen werden automatisch wieder hinzugefügt.
  • Weiterleiten des Traffics auf die nächstgelegene virtuelle Maschine

Der GCP-Lastenausgleich nutzt die Ressourcen der Weiterleitungsregeln, um bestimmte Arten von Traffic zu verarbeiten und sie an ein Lastenausgleichsmodul weiterzuleiten. Zum Beispiel kann eine Weiterleitungsregel den TCP-Traffic, der für Port 80 auf der IP-Adresse 192.0.2.1 bestimmt ist, verarbeiten und ihn dann an ein Lastenausgleichsmodul übergeben, das ihn danach an fehlerfreie VM-Instanzen leitet.

Der GCP-Lastenausgleich ist ein Managed Service, d. h., seine Komponenten sind redundant und hoch verfügbar. Wenn eine Lastenausgleichskomponente ausfällt, wird sie neu gestartet oder automatisch und sofort ersetzt.

GCP bietet verschiedene Arten des Lastenausgleichs, die sich in den Funktionen, Nutzungsszenarien und der Konfigurationsmethode unterscheiden. Weitere Informationen finden Sie unter Lastenausgleich.

Automatische Skalierung

Compute Engine bietet eine automatische Skalierung, wenn bei zunehmender oder abnehmender Last virtuelle Maschinen einer Instanzgruppe automatisch hinzugefügt oder entfernt werden sollen. Auf diese Weise können Ihre Anwendungen anstandslos einen zunehmenden Datenverkehr bewältigen und die Kosten reduzieren, wenn der Bedarf an Ressourcen geringer ist. Sie definieren einfach nur die Richtlinien für die automatische Skalierung und Autoscaling führt eine automatische Skalierung basierend auf der gemessenen Last durch.

Richtlinien

Wählen Sie aus einer Vielzahl von Richtlinien aus, die Autoscaling zum Skalieren Ihrer virtuellen Maschinen verwenden kann. Wenn Sie Autoscaling einrichten, müssen Sie mindestens eine Richtlinie angeben. Wenn Sie mehrere Richtlinien verwenden, erfolgt die Skalierung basierend auf der Richtlinie mit der höchsten Anzahl virtueller Maschinen in der Gruppe.

In den folgenden Abschnitten werden die Autoscaling-Richtlinien im Allgemeinen behandelt. Weitere Informationen zum Einrichten einer bestimmten Autoscaling-Richtlinie finden Sie in der entsprechenden Richtliniendokumentation.

CPU-Auslastung

Die CPU-Auslastung ist die einfachste automatische Skalierung, die Sie ausführen können. Diese Richtlinie sagt dem Autoscaling, dass es die durchschnittliche CPU-Auslastung einer Gruppe von virtuellen Maschinen überwachen und virtuelle Maschinen der Gruppe hinzufügen oder daraus entfernen soll, um die gewünschte Auslastung Ihrer Anwendung aufrecht zu erhalten. Dies ist insbesondere bei CPU-intensiven Konfigurationen nützlich, könnte jedoch je nach CPU-Auslastung schwanken.

Weitere Informationen hierzu finden Sie unter Basierend auf der CPU-Auslastung skalieren.

Bereitstellungskapazität des Lastenausgleichs

Sie sollten Autoscaling so einstellen, dass die Skalierung entsprechend der Bereitstellungskapazität des Lastenausgleichs erfolgt. Autoscaling überwacht dann die Kapazität einer Instanzgruppe und skaliert, wenn die virtuellen Maschinen über oder unter dieser Kapazität liegen.

Die Bereitstellungskapazität einer Instanz kann beim Back-End-Dienst des Lastenausgleichsmoduls festgelegt werden und entweder auf der Nutzung oder den Anfragen pro Sekunde basieren.

Weitere Informationen hierzu finden Sie unter Skalierung basierend auf HTTP(S)-Lastenausgleich.

Stackdriver Monitoring-Messwerte

Wenn Sie exportieren oder Stackdriver Monitoring-Messwerte verwenden, können Sie die automatische Skalierung so einrichten, dass Daten eines speziellen Messwertes gesammelt werden und eine Skalierung aufgrund Ihres gewünschten Nutzungsgrades erfolgt. Eine Skalierung ist basierend auf den Standardmesswerten von Stackdriver Monitoring möglich oder mit beliebigen benutzerdefinierten Messwerten, die Sie erstellen.

Weitere Informationen hierzu finden Sie unter Skalierung basierend auf Stackdriver Monitoring-Messwerten.

Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit:

Feedback geben zu...

Compute Engine-Dokumentation