Autoscaling von Instanzgruppen

Verwaltete Instanzgruppen bieten Autoscaling-Funktionen, mit denen Sie automatisch Instanzen lastabhängig hinzufügen oder entfernen können. So gelingt es Anwendungen, Traffic-Anstiege problemlos zu bewältigen. Bei geringerem Ressourcenbedarf sinken außerdem die Kosten. Dazu definieren Sie einfach eine Autoscaling-Richtlinie für das automatische Skalieren, basierend auf der gemessenen Last.

Beim Autoscaling werden bei höherer Last mehr Instanzen zu Ihrer Instanzgruppe hinzugefügt (Upscaling) und Instanzen gelöscht, wenn die Anzahl der benötigten Instanzen abnimmt (Downscaling).

Grundlagen

Autoscaling nutzt die folgenden grundlegenden Konzepte und Dienste.

Verwaltete Instanzgruppen

Autoscaling ist ein Merkmal verwalteter Instanzgruppen. Diese umfassen eine Reihe homogener Instanzen, die aus einer gemeinsamen Instanzvorlage erstellt wurden. Beim Autoscaling werden Instanzen zu einer verwalteten Instanzgruppe hinzugefügt oder daraus entfernt. Compute Engine hat zwar sowohl verwaltete als auch nicht verwaltete Instanzgruppen, aber nur bei Ersteren ist Autoscaling möglich.

Welche Unterschiede es zwischen verwalteten und nicht verwalteten Instanzgruppen gibt, lesen Sie in der Dokumentation zu Instanzgruppen.

Autoscaling-Richtlinie und Zielauslastung

Für das Autoscaling müssen Sie eine Autoscaling-Richtlinie und ein Zielauslastungslevel festlegen, anhand dessen ermittelt wird, wann eine Skalierung der Gruppe notwendig ist. Die Skalierung kann abhängig von den folgenden Elementen erfolgen:

  • Durchschnittliche CPU-Auslastung
  • Bereitstellungskapazität des HTTP-Lastenausgleichs, die auf der Auslastung oder den Anfragen pro Sekunde basieren kann
  • Stackdriver Monitoring-Messwerte

Für das Autoscaling werden Informationen basierend auf der Richtlinie gesammelt, mit der gewünschten Zielauslastung verglichen und es wird ermittelt, ob eine Skalierung nötig ist.

Die Zielauslastung bestimmt das gewünschte Auslastungslevel Ihrer VM-Instanzen. Wenn Sie zum Beispiel basierend auf der CPU-Auslastung skalieren möchten, können Sie als Zielauslastungslevel den Wert 75 % festlegen. Das Autoscaling sorgt dann dafür, dass die CPU-Auslastung der Instanzgruppe immer ungefähr bei 75 % liegt. Das Auslastungslevel für den jeweiligen Messwert wird auf Grundlage der Autoscaling-Richtlinie interpretiert.

Eine kurze Zusammenfassung der einzelnen Richtlinien finden Sie unter Autoscaling-Richtlinien in der Übersicht. Detaillierte Informationen zu den einzelnen Richtlinien finden Sie hier:

Spezifikationen

  • Autoscaling funktioniert nur mit verwalteten Instanzgruppen. Nicht verwaltete Instanzgruppen werden nicht unterstützt.
  • Verwenden Sie Compute Engine-Autoscaling nicht mit verwalteten Instanzgruppen, die zu Google Kubernetes Engine gehören. Verwenden Sie für Google Kubernetes Engine-Gruppen stattdessen Cluster-Autoscaling.

    Wenn Sie sich nicht sicher sind, ob Ihre Gruppe Teil eines Google Kubernetes Engine-Clusters ist, suchen Sie nach dem Präfix gke im Namen der verwalteten Instanzgruppe. Beispiel: gke-test-1-3-default-pool-eadji9ah

  • Ein Autoscaling kann Entscheidungen bezüglich Skalierung basierend auf mehreren Messwerten treffen, jedoch nur eine Richtlinie pro Messwerttyp verarbeiten. Eine Ausnahme sind Stackdriver Monitoring-Messwerte, für die bis zu fünf Richtlinien ausgewählt werden können. Das Autoscaling berechnet die empfohlene Anzahl virtueller Maschinen für jede Richtlinie und skaliert dann basierend auf der Richtlinie, die die höchste Anzahl virtueller Maschinen in der Gruppe bereitstellt.

Hinweise

  1. Informationen zu verwalteten Instanzgruppen

    Autoscaling ist ein Merkmal verwalteter Instanzgruppen, daher sollten Sie wissen, wie diese funktionieren, ehe Sie das Autoscaling verwenden.

  2. Name oder URL einer verwalteten Instanzgruppe abrufen

    Alle Autoscaling-Anfragen erfordern entweder den Namen oder die URL einer verwalteten Instanzgruppe. Im gcloud-Befehlszeilentool können Sie den Namen einer verwalteten Instanzgruppe verwenden, während in der API eine vollqualifizierte URL erforderlich ist.

    Die URL einer bestehenden verwalteten Instanzgruppe können Sie mit dem Befehl instance-groups managed list --uri oder instance-groups managed list [INSTANCE_GROUP] --uri abrufen. Mit dem folgenden Befehl erhalten Sie zum Beispiel die URL einer verwalteten Instanzgruppe in der Zone us-central1-f:

    gcloud compute instance-groups managed list example-group --uri --filter="zone:(us-central1-f)"
    

    Das Tool gcloud gibt die URL der verwalteten Instanzgruppe aus:

    https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-group
    

    Falls Sie noch keine Gruppe haben, lesen Sie, wie Sie eine verwaltete Instanzgruppe erstellen.

Weitere Informationen

Als Nächstes können Sie das Autoscaling einrichten, um Instanzen basierend auf der Bereitstellungskapazität von CPU oder Lastenausgleich bzw. auf der Basis eines Stackdriver Monitoring-Messwerts zu skalieren.

Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit:

Feedback geben zu...

Compute Engine-Dokumentation