Autoscaling-Entscheidungen

Beim Autoscaling werden Ihrer verwalteten Instanzgruppe (MIG) automatisch VMs hinzugefügt (hochskaliert) oder VMs werden daraus entfernt (herunterskaliert). In diesem Dokument wird erläutert, wie Autoscaling bestimmt, wann Ihre MIGs skaliert werden.

Wenn Sie Autoscaling für eine MIG konfigurieren, überwacht das Autoscaling ständig die Gruppe und legt die recommendedSize der Gruppe auf die Anzahl der VM-Instanzen fest, die erforderlich sind, um die Spitzenlast in den letzten 10 Minuten zu bedienen. Diese letzten 10 Minuten werden als Stabilisierungszeitraum bezeichnet.

Wenn Sie eine Autoscaling-Richtlinie mit Steuerelementen für die Herunterskalierung festlegen, wird recommendedSize durch Ihre Steuerelemente für die Herunterskalierung eingeschränkt.

Die Reaktion der verwalteten Instanzgruppe auf die empfohlene Größe des Autoscalings hängt davon ab, wie Sie den mode des Autoscalings konfigurieren:

  • ON: Die verwaltete Instanzgruppe legt ihre targetSize auf die empfohlene Größe fest und die Gruppe wird automatisch skaliert, um die Zielgröße zu erreichen.
  • ONLY_SCALE_OUT: Die Zielgröße der MIG kann nur als Reaktion auf eine erhöhte empfohlene Größe gesteigert werden.
  • OFF: Die empfohlene Größe hat keine Auswirkungen auf die Zielgröße. Die empfohlene Größe wird aber dennoch berechnet.

Wenn die Autoscaling-Konfiguration gelöscht wird, wird keine empfohlene Größe berechnet.

Differenz zwischen Soll- und Ist-Auslastung

Während des Autoscaling-Prozesses stellen Sie eventuell fest, dass die tatsächliche Auslastung von kleineren Instanzgruppen stark von der Zielauslastung abweicht. Dies liegt daran, dass das Autoscaling beim Interpretieren der Auslastungsdaten und bei der Entscheidung, wie viele Instanzen hinzugefügt oder entfernt werden, durch Auf- oder Abrunden immer konservativ handelt. So wird verhindert, dass das Autoscaling eine unzureichende Anzahl von Ressourcen hinzufügt oder zu viele Ressourcen entfernt.

Wenn Sie zum Beispiel ein Auslastungsziel von 0,7 festlegen und Ihre Anwendung das Auslastungsziel überschreitet, bestimmt das Autoscaling möglicherweise, dass das Hinzufügen von 1,5 VM-Instanzen die Auslastung auf etwa 0,7 verringern würde. Da es nicht möglich ist, 1,5 VM-Instanzen hinzuzufügen, rundet das Autoscaling auf und fügt 2 Instanzen hinzu. Dies könnte die durchschnittliche CPU-Auslastung auf einen Wert unter 0,7 verringern, sorgt jedoch dafür, dass Ihre Anwendung immer genügend Ressourcen hat.

Wenn das Autoscaling entsprechend bestimmt, dass das Entfernen von 1,5 VM-Instanzen Ihre Auslastung auf etwa 0,7 erhöht, wird nur 1 Instanz entfernt.

Bei größeren Gruppen mit mehreren VM-Instanzen wird die Auslastung auf eine größere Anzahl von Instanzen aufgeteilt und das Hinzufügen oder Entfernen von VM-Instanzen verursacht nur eine kleinere Differenz zwischen tatsächlicher Auslastung und Zielauslastung.

Regionale MIGs und ungleiche VM-Verteilungen

Wenn eine Region eine unausgeglichene Anzahl von Instanzen zwischen Zonen aufweist, sei es aufgrund der Wiederherstellung nach einem zonalen Fehler oder aufgrund einer ungleichmäßig verteilten Arbeitslast, hält das Autoscaling mehr Instanzen in Zonen mit einer überdurchschnittlichen tatsächlichen Auslastung. Compute Engine ergreift diese Vorsichtsmaßnahme, um eine hohe Verfügbarkeit in der gesamten Region sowie in allen Zonen zu gewährleisten, auch wenn einige Zonen stärker beansprucht werden als andere.

Verzögerungen beim Hochskalieren

Wenn Sie das Autoscaling konfigurieren, geben Sie eine Wartezeit an, die die Zeitspanne widerspiegelt, die Ihre VMs für die Initialisierung benötigen. Während dieser Wartezeit ignoriert das Autoscaling Nutzungsdaten von VMs.

Wenn Sie einen Wert für die Wartezeit festlegen, der deutlich länger ist als die Initialisierungszeit einer Instanz, ignoriert Ihr Autoscaling möglicherweise legitime Nutzungsdaten und unterschätzt möglicherweise die erforderliche Gruppengröße.

Verzögerungen beim Herunterskalieren

Zum Herunterskalieren wird beim Autoscaling die empfohlene Zielgröße der Gruppe basierend auf der Spitzenlast in den letzten 10 Minuten berechnet. Diese letzten 10 Minuten werden als Stabilisierungszeitraum bezeichnet.

Für das Autoscaling ist es hilfreich, die letzten 10 Minuten der Nutzung zu beobachten, um:

  • Sicherzustellen, dass die gesammelten Informationen aus der Instanzgruppe stabil sind.
  • Zu verhindern, dass das Autoscaling kontinuierlich Instanzen zu schnell hinzufügt oder entfernt.
  • Instanzen sicher zu entfernen, indem ermittelt wird, ob die kleinere Gruppengröße für die Spitzenlast der letzten 10 Minuten ausreicht.

Dieser Stabilisierungszeitraum von 10 Minuten kann beim Herunterskalieren als Verzögerung wahrgenommen werden. Tatsächlich handelt es sich jedoch um ein integriertes Feature des Autoscalings. Mit der Verzögerung wird außerdem sichergestellt, dass eine neue Instanz beim Hinzufügen zur verwalteten Instanzgruppe mindestens 10 Minuten lang ausgeführt wird, bevor sie beendet werden kann.

Wartezeiten für neue Instanzen werden bei der Entscheidung, ob eine Gruppe herunterskaliert wird, ignoriert.

Verbindungsausgleich verursacht Verzögerungen

Wenn die Gruppe Teil eines Back-End-Dienstes ist, für den der Verbindungsausgleich aktiviert ist, kann es nach Ablauf des Verbindungsausgleichs bis zu 60 Sekunden dauern, bis die VM-Instanz entfernt oder gelöscht wird.

Steuerelemente für die Herunterskalierung

Wenn Sie die Autoscaling-Steuerelemente für die Herunterskalierung konfigurieren, steuern Sie damit, wie schnell herunterskaliert wird. Das Autoscaling skaliert nie schneller herunter als die konfigurierte Rate:

Autoscaling mit und ohne Steuerelemente für die Herunterskalierung.

  1. Wenn die Last sinkt, behält das Autoscaling die Größe der Gruppe auf einem Niveau bei, das erforderlich ist, um die in den letzten 10 Minuten beobachtete Spitzenlast zu bewältigen (Stabilisierungszeitraum). Dies funktioniert mit und ohne Steuerelemente für die Herunterskalierung.
  2. Autoscaling ohne Steuerelemente für die Herunterskalierung hält nur so viele Instanzen bereit, wie für die kürzlich beobachtete Last erforderlich sind. Nach dem Stabilisierungszeitraum entfernt das Autoscaling alle nicht benötigten Instanzen in einem Schritt. Wenn die Last plötzlich abfällt, kann dies zu einer drastischen Reduzierung der Instanzgruppengröße führen.
  3. Autoscaling mit Steuerelementen für die Herunterskalierung schränkt ein, wie viele VM-Instanzen in einem konfigurierten Zeitraum entfernt werden können (hier 10 VMs in 20 Minuten). Dadurch wird die Instanzreduzierungsrate verlangsamt.
  4. Mit einem neuen Lastanstieg fügt das Autoscaling neue Instanzen hinzu, um die Last zu verarbeiten. Aufgrund der langen Initialisierungszeit sind die neuen VMs jedoch nicht bereit, die Last zu verarbeiten. Mit den Steuerelementen für die Herunterskalierung wurde die vorherige Kapazität beibehalten, sodass vorhandene VMs den Spitzenwert bewältigen konnten.

Konfigurieren Sie die maximal zulässige Reduzierung des Autoscalings innerhalb eines Nachlaufzeitfensters, um die Skalierungsrate zu steuern. Insbesondere:

  • Maximal zulässige Reduzierung (maxScaledInReplicas: Anzahl oder % der VM-Instanzen) Die Anzahl der Instanzen, die Ihre Arbeitslast innerhalb des angegebenen Nachlaufzeitfensters maximal verlieren darf (aus der Spitzengröße der Gruppe). Verwenden Sie diesen Parameter, um einzuschränken, in welchem Umfang Ihre Gruppe skaliert werden kann. Auf diese Weise kann weiterhin ein wahrscheinlicher Lastanstieg bedient werden, bis mehr Instanzen bereitstehen. Je niedriger die maximal zulässige Reduzierung ist, desto kleiner ist die Skalierungsrate.
  • Nachlaufzeitfenster (timeWindowSec: Sekunden). Zeit, in der ein Lastanstieg wahrscheinlich einem vorübergehenden Rückgang folgt und in der Ihre Gruppengröße nicht über die maximal zulässige Reduzierung hinaus herunterskaliert werden soll. Verwenden Sie diesen Parameter, um das Zeitfenster zu definieren, in dem das Autoscaling nach der Spitzengröße sucht, die für die bisherige Last ausreicht. Autoscaling verkleinert die Größe nicht unter die maximal zulässige Reduzierung, die von der im Nachlaufzeitfenster beobachteten Spitzengröße abgezogen wird. Bei einem längeren Nachlaufzeitfenster berücksichtigt das Autoscaling mehr bisherige Spitzenlasten, wodurch die Herunterskalierung konservativer und stabiler wird.

Wenn Sie Steuerelemente für die Herunterskalierung festlegen, beschränkt das Autoscaling Herunterskalierungsvorgänge auf die maximal zulässige Reduzierung basierend auf der Spitzengröße im Nachlaufzeitfenster. Das Autoscaling führt die folgenden Schritte aus:

  1. Überwacht kontinuierlich die bisherige Spitzengröße im Nachlaufzeitfenster.
  2. Verwendet die maximal zulässige Reduzierung, um die beschränkte Größe fürs Herunterskalieren zu berechnen (Spitzengröße: maxScaledInReplicas)
  3. Legt die empfohlene Größe der Gruppe auf die beschränkte Größe fürs Herunterskalieren fest. Wenn Autoscaling beispielsweise die Größe einer Instanzgruppe auf 20 VMs ändern würde, die Größenbeschränkungen fürs Herunterskalieren jedoch nur eine Skalierung auf 40 VMs zulassen, wird die empfohlene Größe auf 40 VMs festgelegt.

Mit Steuerelementen für die Herunterskalierung überwacht das Autoscaling kontinuierlich die Spitzengröße einer Instanzgruppe innerhalb des konfigurierten Nachlaufzeitfensters, um die Größe zu ermitteln, die für die bisherige Auslastung ausreicht. Autoscaling skaliert nicht über die maximal zulässige Reduzierung hinaus (anhand der beobachteten Spitzengröße gemessen):

Autoscaling mit Steuerelementen für die Herunterskalierung.

Im obigen Diagramm sind die Steuerelemente für die Herunterskalierung beispielsweise für eine maximal zulässige Reduzierung von 20 VMs in einem Nachlaufzeitfenster von 30 Minuten konfiguriert:

  1. Wenn die Last herunterfährt, entfernt das Autoscaling 20 VMs. Dies ist die maximal zulässige Reduzierung, die in den Steuerelementen für die Herunterskalierung konfiguriert ist.
  2. Wenn die Last wächst und fällt, überwacht das Autoscaling ständig das Nachlaufzeitfenster der letzten 30 Minuten auf die Spitzengröße, die ausreicht, um die bisherige Last zu verarbeiten. Diese Spitzengröße wird als Basis für die Skalierung verwendet, um die Herunterskalierungsrate zu begrenzen. Wenn die Spitzengröße in den letzten 30 Minuten 70 VMs betrug und die maximal zulässige Reduzierung auf 20 VMs festgelegt ist, kann das Autoscaling auf 50 VMs skalieren. Wenn die aktuelle Größe 65 VMs beträgt, kann das Autoscaling nur 15 VMs entfernen.
  3. Bei abnehmender Last entfernt das Autoscaling weiterhin VM-Instanzen, begrenzt jedoch die Rate auf maximal 20 VMs von der in den letzten 30 Minuten gemessenen maximalen Instanzgruppengröße.

Die maximal zulässige Reduzierung der Gruppengröße kann sofort erfolgen. Daher sollten Sie die maximal zulässige Reduzierung so konfigurieren, dass Ihre Anwendung es sich leisten kann, so viele Instanzen gleichzeitig zu verlieren. Verwenden Sie den Parameter für die maximal zulässige Reduzierung, um anzugeben, wie viel Reduzierung der Bereitstellungskapazität Ihre Anwendung tolerieren kann.

Die Begrenzung der Anzahl von VM-Instanzen, die durch Autoscaling entfernt werden können, und die Erhöhung des beobachteten Nachlaufzeitfensters sollte für Anwendungen mit Lastspitzen und langen Initialisierungszeiten die Verfügbarkeit verbessern. Insbesondere sinkt die Größe der Instanzgruppe nicht abrupt als Reaktion auf einen signifikanten Lastabfall und nimmt stattdessen mit der Zeit allmählich ab. Wenn die Last kurz nach einer Skalierung ansteigt, sollte die verbleibende Anzahl von VMs die Spitze dennoch innerhalb Ihrer Toleranz aufnehmen können. Außerdem müssen weniger VMs gestartet werden, um den Spitzenwert ausreichend zu verarbeiten.

Sie können Steuerelemente für die Herunterskalierung für das Autoscaling von zonalen und regionalen MIGs konfigurieren. Die Konfiguration ist in beiden Fällen identisch. Die Steuerelemente für die Herunterskalierung funktionieren für jede Gruppengröße.

Steuerelemente für die Herunterskalierung und Autoscaling-Stabilität

Das Konfigurieren von Steuerelementen für die Herunterskalierung bedeutet nicht, dass der integrierte Stabilisierungsmechanismus des Autoscalings deaktiviert wird. Autoscaling hält die Instanzgruppengröße immer auf einem Niveau, das erforderlich ist, um die Spitzenlast zu bedienen, die während des Stabilisierungszeitraums der letzten 10 Minuten beobachtet wird. Mit den Steuerelementen für die Herunterskalierung können Sie die Größe der Instanzgruppe anpassen.

Integriertes Autoscaling:
Stabilisierungszeitraum
Steuerelemente für die Herunterskalierung:
Nachlaufzeitfenster
Konfigurierbar? Nein, nicht konfigurierbar Ja, konfigurierbar
Was wird überwacht? Überwacht die Spitzenlast in den letzten 10 Minuten Überwacht die Spitzengröße der Instanzgruppe im vorherigen Zeitraum, der durch ein Nachlaufzeitfenster festgelegt wurde
Wie hilft das? Sorgt dafür, dass die Größe der Instanzgruppe ausreicht, um die Spitzenlast zu bewältigen, die in den letzten 10 Minuten beobachtet wurde. Sorgt dafür, dass die Größe der Instanzgruppe nicht um mehr VM-Instanzen reduziert wird, als Ihre Arbeitslast bei der Verarbeitung von Lastspitzen über ein bestimmtes Zeitfenster hinnehmen kann.

Steuerelemente für die Herunterskalierung mit Autoscaling-Modus

Es gibt zwei ähnliche, aber leicht unterschiedliche Szenarien, wenn Ihre MIG nicht automatisch skaliert wird und Sie die automatische Skalierung aktivieren möchten. Diese hängen davon ab, ob Sie Autoscaling zum ersten Mal konfigurieren oder ob Autoscaling konfiguriert, aber vorübergehend eingeschränkt oder deaktiviert ist.

Autoscaling zum ersten Mal konfigurieren

Wenn Sie eine nicht automatisch skalierte MIG haben und Autoscaling von Grund auf neu konfigurieren, verwendet das Autoscaling die aktuelle MIG-Größe als Ausgangspunkt. Vor dem Herunterskalieren verwendet das Autoscaling den Stabilisierungszeitraum und verwendet dann Steuerelemente für die Herunterskalierung, um die Skalierungsrate zu beschränken:

Autoscaling zum ersten Mal konfigurieren

Autoscaling-Modus ändern

Mit dem Autoscaling-Modus können Sie Autoscaling-Aktivitäten vorübergehend deaktivieren oder einschränken. Die Autoscaling-Konfiguration bleibt bestehen und das Autoscaling führt weiterhin Hintergrundberechnungen durch, während das Autoscaling deaktiviert oder eingeschränkt ist. Wenn Autoscaling sich im deaktivierten oder eingeschränkten Modus befindet, berücksichtigt es in seinen Hintergrundberechnungen die Steuerelemente für die Herunterskalierung. Alle Autoscaling-Aktivitäten werden mit den neuesten Berechnungen fortgesetzt, wenn Sie Autoscaling wieder aktivieren oder die Einschränkung aufheben:

Autoscaling wird einschließlich der Steuerelemente für die Herunterskalierung fortgesetzt.

  1. Das AKTIVIERTE Autoscaling funktioniert wie gewohnt (in diesem Fall mit Steuerelementen für die Herunterskalierung).
  2. Wenn Sie das Autoscaling DEAKTIVIEREN, wird die empfohlene Größe der Instanzgruppe basierend auf der Auslastung berechnet. Bei Autoscaling-Berechnungen werden weiterhin Steuerelemente für die Herunterskalierung berücksichtigt. Das Autoscaling wendet jedoch keine Größenberechnungen an, wenn das Autoscaling DEAKTIVIERT ist. Die Größe der Instanzgruppe bleibt konstant, bis das Autoscaling wieder AKTIVIERT ist.
  3. Wenn Sie das Autoscaling wieder AKTIVIEREN, wird sofort die zuvor berechnete Größe angewendet. Dies ermöglicht eine schnellere Skalierung auf die richtige Größe. Das erneute Aktivieren des Autoscalings kann zu einer sprunghaften Skalierung führen (hier von 80 auf 40 VM-Instanzen). Dies ist sicher, da bei Hintergrundberechnungen bereits Steuerelemente für die Herunterskalierung berücksichtigt werden.

Instanzbeendigungen vorbereiten

Wenn Autoscaling herunterskaliert, bestimmt es die Anzahl der herunterzufahrenden VM-Instanzen und wählt VM-Instanzen mit geringer Auslastung aus der Instanzgruppe aus. Bevor eine Instanz beendet wird, sollten Sie prüfen, ob diese Instanz bestimmte Aufgaben ausführt, z. B. bestehende Verbindungen schließen, Anwendungen oder Anwendungsserver ordnungsgemäß herunterfahren, Logs hochladen usw. Sie können Ihrer Instanz über ein Shutdown-Skript die Anweisung geben, diese Aufgaben auszuführen.

Das Shutdown-Skript läuft in dem kurzen Zeitraum zwischen erfolgter Beendigungsanfrage und tatsächlicher Beendigung der Instanz auf einer Best-Effort-Basis. In diesem Zeitraum versucht Compute Engine, Ihr Shutdown-Skript und alle in dem Skript angegebenen Aufgaben auszuführen.

Dies ist besonders nützlich, wenn Sie Load-Balancing für Ihre verwaltete Instanzgruppe verwenden. Wenn die Instanz fehlerhaft ist, kann es einige Zeit dauern, bis der Lastenausgleich erkennt, dass die Instanz fehlerhaft ist. Dies führt dazu, dass der Lastenausgleich weiterhin neue Anfragen an die Instanz sendet. Mit einem Shutdown-Skript kann die Instanz berichten, dass sie fehlerhaft ist, während sie heruntergefahren wird, sodass der Lastausgleich aufhören kann, Daten zur Instanz zu senden. Weitere Informationen dazu finden Sie unter Fehlerhafte Instanzen handhaben in der Dokumentation zum Load-Balancing.

Weitere Informationen zu Shutdown-Skripts finden Sie unter Shutdown-Skripts.

Weitere Informationen zum Herunterfahren einer Instanz finden Sie in der Dokumentation zum Anhalten oder Löschen einer Instanz.

Autoscaling-Diagramme zur Auslastung ansehen

Wenn Sie eine verwaltete Instanzgruppe haben, die automatisch skaliert wird, bietet Compute Engine ein Autoscaling-Diagramm, das die gesamte Auslastung und die Anzahl der automatisch skalierten Instanzen zu jedem Zeitpunkt verfolgt. Auf dieses Diagramm können Sie in der Google Cloud Console zugreifen.

  1. Rufen Sie in der Cloud Console die Seite Instanzgruppen auf.

    Zur Seite "Instanzgruppen"

  2. Klicken Sie auf den Namen einer automatisch skalierten verwalteten Instanzgruppe, die Sie anzeigen lassen möchten. Die Gruppe muss das Autoscaling entsprechend der CPU-Auslastung vornehmen. Andere Autoscaling-Messwerte werden derzeit nicht unterstützt.
  3. Wählen Sie auf der Detailseite der verwalteten Instanzgruppen den Tab Monitoring aus, falls nicht bereits geschehen.

    Tab

  4. Achten Sie darauf, dass Automatisch skalierte Größe in der Drop-down-Liste ausgewählt ist.

Die Diagramme verfolgen die Anzahl der Instanzen über die CPU-Auslastung. Im Folgenden finden Sie Informationen zu diesen Diagrammen:

  • Die blaue Linie im oberen Diagramm zeigt die Anzahl der Instanzen in der verwalteten Instanzgruppe an.
  • Die blaue Linie im unteren Diagramm zeigt die gesamte CPU-Auslastung der verwalteten Instanzgruppe an.
  • Die grüne Linie im unteren Diagramm zeigt die verbleibende verfügbare Kapazität der verwalteten Instanzgruppe an.
    • Wenn sich die grüne Linie über der blauen Linie befindet, steht eine große Menge an Kapazität zur Verfügung und die VM-Instanzen sind wahrscheinlich unverhältnismäßig gering ausgelastet.
    • Wenn sich die grüne Linie unterhalb der blauen Linie befindet, ist sehr wenig oder gar keine Kapazität mehr vorhanden und Sie sollten der Instanzgruppe weitere Instanzen hinzufügen.
  • Wenn die Kapazität geringer wird, bedeutet das wahrscheinlich, dass sich die Größe der Instanzgruppe ebenfalls verringert hat, und die blaue Linie im oberen Diagramm fällt daher ab. Wenn sich die Kapazität dagegen erhöht, vergrößert sich die Instanzgruppe wahrscheinlich ebenfalls.

Die folgende Grafik stellt beispielhaft eine automatisch skalierte verwaltete Instanzgruppe dar, die ihre Kapazität erreicht. Das Autoscaling fügt der Gruppe entsprechend weitere VM-Instanzen hinzu und erhöht so ihre Kapazität.

Diagramm: Wenn die Auslastung die Kapazität überschreitet, fügt das Autoscaling Instanzen hinzu.
              Wenn die Auslastung 10 Minuten lang abfällt, entfernt das Autoscaling Instanzen.
Autoscaling-Diagramm

Statusmeldungen ansehen

Wenn im Autoscaling bei der Skalierung ein Problem auftritt, wird eine Warnung oder eine Fehlermeldung ausgegeben. Sie können diese Statusmeldungen auf zwei Arten prüfen.

Statusmeldungen auf der Seite "Instanzgruppen" ansehen

Statusmeldungen können Sie sich direkt auf der Seite Instanzgruppen in der Google Cloud Console ansehen.

  1. Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.

    Zur Seite "Instanzgruppen"

  2. Suchen Sie nach Instanzgruppen mit dem Vorsichtssymbol (!). Beispiel:

    Statusmeldungen auf der Seite

  3. Bewegen Sie den Mauszeiger über ein Statussymbol, um Details zur Statusmeldung zu sehen.

Statusmeldungen auf der Seite der Instanzgruppendetails ansehen

Sie können direkt zur Detailseite einer bestimmten Instanzgruppe wechseln, um relevante Statusmeldungen zu sehen.

  1. Rufen Sie in der Cloud Console die Seite Instanzgruppen auf.

    Zur Seite "Instanzgruppen"

  2. Klicken Sie auf die Instanzgruppe, für die Sie Statusmeldungen sehen möchten.
  3. Schauen Sie sich auf der Detailseite auf dem Tab Mitglieder die Statusmeldung an. Beispiel:

    Statusmeldungen auf der Seite der Instanzgruppendetails

Gängige Statusrückmeldungen

Wenn im Autoscaling bei der Skalierung ein Problem auftritt, wird eine Warnung oder eine Fehlermeldung ausgegeben. Hier sind einige der häufigsten Rückmeldungen und deren Bedeutung.

All instances in the instance group are unhealthy (not in RUNNING state). If this is an error, check the instances.
Alle Instanzen in der Instanzgruppe haben einen anderen Status als RUNNING. Wenn dies beabsichtigt ist, können Sie diese Meldung ignorieren. Falls dies nicht beabsichtigt ist, beheben Sie den Fehler in der Instanzgruppe.
The number of instances has reached the maxNumReplicas. The autoscaler cannot add more instances.
Bei der Erstellung des Autoscalings haben Sie die maximale Anzahl der Instanzen für die Instanzgruppe angegeben. Autoscaling versucht derzeit, die Instanzgruppe nach Bedarf hochzuskalieren, hat jedoch die maxNumReplicas erreicht. Informationen zum Ändern des Werts von maxNumReplicas in eine größere Zahl finden Sie unter Autoscaling aktualisieren.
The monitoring metric that was specified does not exist or does not have the required labels. Check the metric.
Sie führen ein Autoscaling mit einem Stackdriver Monitoring-Messwert durch, aber der von Ihnen angegebene Messwert existiert nicht oder verfügt nicht über die erforderlichen Label. Je nachdem, ob der Messwert ein Standard- oder benutzerdefinierter Messwert ist, sind unterschiedliche Label erforderlich. Weitere Informationen finden Sie in der Dokumentation zur Skalierung basierend auf einem Monitoring-Messwert.
Quota for some resources is exceeded. Increase the quota or delete resources to free up more quota.
Sie können sich Informationen zu Ihren verfügbaren Kontingenten auf der Kontingentseite der Google Cloud Console ansehen.
Autoscaling does not work with an HTTP/S load balancer configured for maxRate.
Das Load-Balancing der Instanzgruppe erfolgt mit der maxRate-Konfiguration, aber das Autoscaling unterstützt diesen Modus nicht. Ändern Sie die Konfiguration oder deaktivieren Sie das Autoscaling. Weitere Informationen zu maxRate finden Sie in der Dokumentation zum Load-Balancing unter Einschränkungen und Richtlinien.
The autoscaler is configured to scale based on a load balancing signal but the instance group has not received any queries from the load balancer. Check that the load balancing configuration is working.
Für die Instanzgruppe erfolgt ein Load-Balancing, aber es gibt keine eingehenden Abfragen für die Gruppe. Der Dienst befindet sich möglicherweise im Leerlauf. In diesem Fall besteht kein Grund zur Sorge. Diese Meldung kann jedoch auch durch fehlerhafte Konfiguration verursacht werden. Beispielsweise kann eine automatisch skalierte Instanzgruppe das Ziel von mehr als einem Load-Balancer sein, was nicht unterstützt wird. Eine vollständige Liste der Richtlinien finden Sie unter Einschränkungen und Richtlinien in der Dokumentation zum Load-Balancing.