Die einfachste Form von Autoscaling besteht darin, eine verwaltete Instanzgruppe (managed instance group, MIG) anhand der CPU-Auslastung ihrer Instanzen zu skalieren.
Sie können MIGs auch anhand von Load-Balancing-Bereitstellungskapazität, Monitoringmesswerten oder Zeitplänen automatisch skalieren.
Hinweise
- Prüfen Sie die Einschränkungen für Autoscaling.
- Grundlagen von Autoscaling
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud-Dienste und APIs überprüft.
Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich wie folgt bei Compute Engine authentifizieren.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- Set a default region and zone.
Rufen Sie in der Cloud Console die Seite Instanzgruppen auf.
Wenn Sie eine Instanzgruppe haben, wählen Sie sie aus und klicken Sie auf Gruppe bearbeiten. Wenn Sie keine Instanzgruppe haben, klicken Sie auf Instanzgruppe erstellen.
Wenn keine Autoscaling-Konfiguration vorhanden ist, klicken Sie unter Autoscaling auf Autoscaling konfigurieren.
Wählen Sie unter Autoscaling-Modus die Option Ein: der Gruppe Instanzen hinzufügen und aus ihr entfernen aus, um Autoscaling zu aktivieren.
Geben Sie die minimale und maximale Anzahl von Instanzen an, die das Autoscaling in dieser Gruppe erstellen soll.
Fügen Sie im Abschnitt Autoscaling-Messwerte einen vorhandenen Messwert für die CPU-Auslastung hinzu, falls noch nicht vorhanden.
- Klicken Sie auf Messwert hinzufügen.
- Wählen Sie unter Messwerttyp die Option CPU-Auslastung aus.
- Geben Sie die gewünschte Ziel-CPU-Auslastung ein. Dieser Wert wird als Prozentsatz behandelt. Bei einer CPU-Auslastung von beispielsweise 75 % geben Sie den Wert
75
ein. - Wählen Sie unter Vorausschauendes Autoscaling die Option Aus aus. Weitere Informationen zum vorausschauenden Autoscaling und dazu, ob es für Ihre Arbeitslast geeignet ist, finden Sie unter Anhand von Vorhersagen skalieren.
- Klicken Sie auf Fertig.
Über die Initialisierungsphase können Sie angeben, wie lange Ihre Anwendung zur Initialisierung benötigt. Wenn Sie die Initialisierungsphase genau definieren, verbessern Sie die Autoscaling-Entscheidungen. Beim horizontalen Skalieren werden so beispielsweise Daten von VMs ignoriert, die noch initialisiert werden, da diese möglicherweise nicht die normale Nutzung Ihrer Anwendung darstellen. Die Standardinitialisierungsphase beträgt 60 Sekunden.
Klicken Sie auf Speichern.
- Mehr über die Aktivierung des vorausschauenden Autoscaling erfahren
- Autoscalings verwalten
- Mehr über die Faktoren des Autoscalings erfahren
- Mehr über das Skalieren von Gruppen mit mehreren Autoscaling-Signalen erfahren
REST
Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
Weitere Informationen finden Sie unter Für die Verwendung von REST authentifizieren in der Dokumentation zur Google Cloud-Authentifizierung.
Anhand der CPU-Auslastung skalieren
Sie können ein Autoscaling anhand der durchschnittlichen CPU-Auslastung einer verwalteten Instanzgruppe durchführen. Anhand dieser Richtlinie erfasst das Autoscaling die CPU-Auslastung der Instanzen in der Gruppe und bestimmt, ob eine Skalierung erforderlich ist. Sie legen die Ziel-CPU-Auslastung fest, die das Autoscaling nach Möglichkeit einhalten soll.
Das Autoscaling behandelt das Ziel-CPU-Auslastungsniveau als Bruchteil der durchschnittlichen Nutzung aller vCPUs in der Instanzgruppe im Zeitverlauf. Wenn die durchschnittliche Auslastung aller vCPUs die Zielauslastung überschreitet, fügt das Autoscaling weitere virtuelle Maschinen hinzu. Wenn die durchschnittliche Auslastung aller vCPUs geringer als die Zielauslastung ist, entfernt das Autoscaling Instanzen. Bei einer Zielauslastung von 0,75 muss das Autoscaling beispielsweise eine durchschnittliche Nutzung von 75 % für alle vCPUs in der Instanzgruppe aufrechterhalten.
Sie können die Skalierung auch auf Grundlage der prognostizierten CPU-Auslastung ausführen. Weitere Informationen und Informationen dazu, ob dies für Ihre Arbeitslast geeignet ist, finden Sie unter Anhand von Vorhersagen skalieren.
Autoscaling basierend auf der CPU-Auslastung aktivieren
Console
gcloud
Mit dem Unterbefehl
set-autoscaling
können Sie das Autoscaling für eine verwaltete Instanzgruppe aktivieren. Durch den folgenden Befehl wird z. B. ein Autoscaling mit einer CPU-Zielauslastung von 60 % erstellt. Neben dem Parameter--target-cpu-utilization
ist beim Erstellen eines Autoscalings auch der Parameter--max-num-replicas
erforderlich:gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \ --max-num-replicas 20 \ --target-cpu-utilization 0.60 \ --cool-down-period 90
Sie können das Flag
--cool-down-period
verwenden, um die Initialisierungsphase festzulegen. Dieser Wert teilt dem Autoscaling mit, wie lange Ihre Anwendung zur Initialisierung benötigt. Wenn Sie die Initialisierungsphase genau definieren, verbessern Sie die Autoscaling-Entscheidungen. Beim horizontalen Skalieren werden so beispielsweise Daten von VMs ignoriert, die noch initialisiert werden, da diese möglicherweise nicht die normale Nutzung Ihrer Anwendung darstellen. Die Standardinitialisierungsphase beträgt 60 Sekunden.Optional können Sie das vorausschauende Autoscaling aktivieren, damit bereits vor dem Auftreten der erwarteten Arbeitslast horizontal skaliert wird. Informationen dazu, ob vorausschauendes Autoscaling für Ihre Arbeitslast geeignet ist, finden Sie unter Anhand von Vorhersagen skalieren.
Mit dem
instance-groups managed describe
-Unterbefehl können Sie prüfen, ob Autoscaling erfolgreich aktiviert ist. Damit wird die entsprechende verwaltete Instanzgruppe beschrieben und es werden Informationen zu den Autoscaling-Features für diese Instanzgruppe bereitgestellt:gcloud compute instance-groups managed describe example-managed-instance-group
Eine Liste der verfügbaren
gcloud
-Befehle und Flags finden Sie in der Referenz zugcloud
.REST
Verwenden Sie zum Erstellen eines Autoscalings die Methode
autoscalers.insert
für eine zonale MIG oder die MethoderegionAutoscalers.insert
für eine regionale MIG.Im folgenden Beispiel wird ein Autoscaling für eine zonale MIG erstellt:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/
Der Text Ihrer Anfrage muss die Felder
name
,target
undautoscalingPolicy
enthalten.cpuUtilization
undmaxNumReplicas
müssen durchautoscalingPolicy
definiert sein.Sie können das Feld
coolDownPeriodSec
verwenden, um die Initialisierungsphase festzulegen, damit Autoscaling weiß, wie lange Ihre Anwendung zur Initialisierung benötigt. Wenn Sie die Initialisierungsphase genau definieren, verbessern Sie die Autoscaling-Entscheidungen. Beim horizontalen Skalieren werden so beispielsweise Daten von VMs ignoriert, die noch initialisiert werden, da diese möglicherweise nicht die normale Nutzung Ihrer Anwendung darstellen. Die Standardinitialisierungsphase beträgt 60 Sekunden.Optional können Sie das vorausschauende Autoscaling aktivieren, damit bereits vor dem Auftreten der erwarteten Arbeitslast horizontal skaliert wird. Informationen dazu, ob vorausschauendes Autoscaling für Ihre Arbeitslast geeignet ist, finden Sie unter Anhand von Vorhersagen skalieren.
{ "name": "example-autoscaler", "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-managed-instance-group", "autoscalingPolicy": { "maxNumReplicas": 10, "cpuUtilization": { "utilizationTarget": 0.6 }, "coolDownPeriodSec": 90 } }
Weitere Informationen zum Aktivieren des Autoscalings auf Grundlage der CPU-Auslastung finden Sie in der Anleitung Autoscaling für hochskalierbare Anwendungen verwenden.
Autoscaling bei starker CPU-Auslastung
Wenn bei einer starken CPU-Auslastung fast ein Wert von 100 % erreicht wird, geht das Autoscaling davon aus, dass die Gruppe bereits stark überlastet ist. In diesen Fällen erhöht das Autoscaling die Anzahl virtueller Maschinen um höchstens 50 %.
Nächste Schritte
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2024-11-25 (UTC).
-