Anhand von Vorhersagen skalieren

Sie können das Autoscaling für eine verwaltete Instanzgruppe (MIG) konfigurieren, um VM-Instanzen abhängig von Lastzunahmen oder -abnahmen automatisch hinzuzufügen oder zu entfernen. Wenn die Anwendung jedoch einige Minuten oder länger zur Initialisierung benötigt, führt das Hinzufügen von Instanzen als Reaktion auf Echtzeitänderungen unter Umständen nicht dazu, die Kapazität Ihrer Anwendung schnell genug zu erhöhen. Wenn beispielsweise die Auslastung stark erhöht wird (z. B. wenn die Nutzer am Morgen aufwachen), kann es zu einigen Verzögerungen kommen, während die Anwendung auf neuen Instanzen initialisiert wird.

Sie können das vorausschauende Autoscaling dazu verwenden, die Antwortzeiten für Anwendungen zu verbessern, die lange Initialisierungszeiten haben und deren Arbeitslasten vorhersehbar in täglichen oder wöchentlichen Zyklen variieren.

Wenn Sie das vorausschauende Autoscaling aktivieren, prognostiziert Compute Engine die zukünftige Last basierend auf dem Verlauf Ihrer MIG und skaliert die MIG für die vorhergesagte Last, sodass neue Instanzen für den Empfang bereit sind. Ohne vorausschauendes Autoscaling kann das Autoscaling eine Gruppe nur in direkter Reaktion auf beobachtete Laständerungen in Echtzeit skalieren. Bei aktiviertem vorausschauendem Autoscaling arbeitet das Autoscaling mit Echtzeitdaten und Verlaufsdaten, um sowohl die aktuelle als auch die prognostizierte Last zu berücksichtigen. Weitere Informationen finden Sie unter Funktionsweise von vorausschauendem Autoscaling und Eignung von vorausschauendem Autoscaling für Ihre Arbeitslast prüfen.

Hinweise

Wenn Sie die Befehlszeilenbeispiele in dieser Anleitung verwenden möchten, installieren Sie die Google Cloud CLI oder starten Sie Cloud Shell.
Grundlagen von Autoscaling
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud-Dienste und APIs überprüft. Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren.

Wählen Sie den Tab für die Verwendung der Beispiele auf dieser Seite aus:
Console

Wenn Sie über die Google Cloud Console auf Google Cloud-Dienste und -APIs zugreifen, müssen Sie die Authentifizierung nicht einrichten.
gcloud
1. Installieren Sie die Google Cloud CLI und initialisieren Sie sie mit folgendem Befehl:
```
gcloud init
```
  Hinweis: Wenn Sie die gcloud CLI zuvor installiert haben, prüfen Sie, ob Sie die neueste Version haben, indem Sie gcloud components update ausführen.
2. Legen Sie eine Standardregion und -zone fest.
REST

Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.

Preise

Vorausschauendes Autoscaling ist kostenlos. Wenn Sie jedoch das vorausschauende Autoscaling zur Optimierung der Verfügbarkeit aktivieren, zahlen Sie für die von Ihrer MIG verwendeten Compute Engine-Ressourcen.

Beschränkungen

Vorausschauende Autoscaling funktioniert nur mit der CPU-Auslastung als Skalierungsmesswert. Cloud Load Balancing- oder Cloud Monitoring-Messwerte werden nicht unterstützt.
Compute Engine benötigt einen CPU-basierten Autoscaling-Verlauf von 3 Tagen, bevor Vorhersagen generiert werden können.
Vorhersagen basieren auf wöchentlichen und täglichen Auslastungsmustern. Compute Engine sagt keine monatlichen, jährlichen oder einmalige Ereignisse vorher, und Lastmuster, die kürzer als 10 Minuten sind, werden auch nicht vorhergesagt. Mithilfe des zeitplanbasierten Autoscalings können Sie Kapazitäten für einmalige oder andere Lastmuster anfordern.

Geeignete Arbeitslasten

Das vorausschauende Autoscaling funktioniert am besten, wenn Ihre Arbeitslast folgende Kriterien erfüllt:

Die Initialisierung der Anwendung dauert sehr lange. Dies ist beispielsweise der Fall, wenn Sie einen Initialisierungszeitraum konfigurieren, der länger als 2 Minuten ist.
Ihre Arbeitslast variiert vorhersagbar mit täglichen oder wöchentlichen Zyklen.

Wenn die Initialisierung Ihres Dienstes lange dauert, können Nutzer nach dem Skalieren des Ereignisses eine Dienstlatenz feststellen, während die neuen VMs bereitgestellt sind, aber noch nicht liefern. Das vorausschauende Autoscaling berücksichtigt die Initialisierungszeit Ihrer Anwendung und skaliert sie vor der vorhergesagten Nutzungssteigerung. So wird sichergestellt, dass die Anzahl der verfügbaren, liefernden Instanzen für die Zielauslastung ausreicht.

Wie sich das vorausschauende Autoscaling auf Ihre Gruppe auswirkt, erfahren Sie unter Eignung von vorausschauendem Autoscaling für Ihre Arbeitslast prüfen.

Vorausschauendes Autoscaling aktivieren und deaktivieren

Sie können das vorausschauende Autoscaling bei der Skalierung basierend auf der CPU-Auslastung aktivieren. Weitere Informationen zum Einrichten des CPU-basierten Autoscalings finden Sie unter Anhand der CPU-Auslastung skalieren.

Wenn Ihre MIG keinen Autoscaling-Verlauf hat, kann es drei Tage dauern, bis sich der Vorhersage-Algorithmus auf das Autoscaling auswirkt. Während dieser Zeit wird die Gruppe nur auf Basis von Echtzeitdaten skaliert. Nach drei Tagen beginnt die Skalierung der Gruppe dann mit Vorhersagen. Je mehr Verlaufsdaten zur Last erfasst werden, desto besser versteht das vorausschauende Autoscaling Ihre Lastmuster und desto besser werden die Prognosen. Compute Engine benötigt bis zu 3 Wochen lange Lastverlaufsdaten einer MIG, um das Modell für maschinelles Lernen zu füllen.

Erforderliche Berechtigungen für diese Aufgabe

Zum Ausführen dieser Aufgabe benötigen Sie die folgenden Berechtigungen:

compute.autoscalers.update für das Autoscaling der Gruppe
compute.instanceGroupManagers.use für die Gruppe

Console

Rufen Sie in der Cloud Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen
Klicken Sie in der Liste auf den Namen einer vorhandenen MIG, um die Übersichtsseite der Gruppe zu öffnen.
Klicken Sie auf Bearbeiten.
Wenn keine Autoscaling-Konfiguration vorhanden ist, klicken Sie unter Autoscaling auf Autoscaling konfigurieren.
Wählen Sie unter Autoscaling-Modus die Option Ein: der Gruppe Instanzen hinzufügen und aus ihr entfernen aus, um Autoscaling zu aktivieren.
Geben Sie die minimale und maximale Anzahl von Instanzen an, die das Autoscaling in dieser Gruppe erstellen soll.
Fügen Sie im Abschnitt Messwerte für Autoscaling einen Messwert CPU-Auslastung hinzu, falls noch nicht vorhanden:
1. Klicken Sie auf Messwert hinzufügen.
2. Wählen Sie unter Messwerttyp die Option CPU-Auslastung aus.
3. Geben Sie die gewünschte Ziel-CPU-Auslastung ein. Dieser Wert wird als Prozentsatz behandelt. Bei einer CPU-Auslastung von beispielsweise 75 % geben Sie den Wert 75 ein.
4. Wählen Sie unter Vorausschauendes Autoscaling die Option Für Verfügbarkeit optimieren aus, um vorausschauendes Autoscaling zu aktivieren.
  - Wenn Sie den vorausschauenden Algorithmus deaktivieren und nur das Echtzeit-Autoscaling verwenden möchten, wählen Sie Aus aus.
5. Klicken Sie auf Fertig.
Geben Sie unter Initialisierungszeitraum an, wie lange es dauern soll, bis die Anwendung auf einer neuen Instanz initialisiert wird. Diese Einstellung weist das vorausschauende Autoscaling an, vor der erwarteten Last zu skalieren, sodass Anwendungen initialisiert werden, wenn die Last ankommt.
Klicken Sie auf Speichern.

gcloud

Wenn Sie das Autoscaling einer MIG festlegen oder aktualisieren, fügen Sie das Flag --cpu-utilization-predictive-method mit einem der folgenden Werte ein:

optimize-availability: zum Aktivieren des Vorhersage-Algorithmus
none (Standard): zum Deaktivieren des Vorhersage-Algorithmus

Wenn CPU-basiertes Autoscaling für die Gruppe noch nicht aktiviert ist, müssen Sie es aktivieren. Mit dem Befehl set-autoscaling können Sie die Autoscaling-Richtlinie einer Gruppe von Grund auf konfigurieren. Der folgende Befehl zeigt beispielsweise, wie die automatische Skalierung mit den folgenden Einstellungen konfiguriert wird:

Vorausschauendes Autoscaling aktiviert.
CPU-Zielauslastung von 75 %.
Die maximale Anzahl von Instanzen ist auf 20 gesetzt.
Ein Initialisierungszeitraum (--cool-down-period) ist auf 5 Minuten festgelegt. Diese Einstellung weist das vorausschauende Autoscaling an, fünf Minuten vor der erwarteten Last zu skalieren, sodass Anwendungen beim Eintreffen der Last initialisiert werden.

gcloud compute instance-groups managed set-autoscaling MIG_NAME \
  --cpu-utilization-predictive-method optimize-availability \
  --target-cpu-utilization 0.75 \
  --max-num-replicas 20 \
  --cool-down-period 300

Wenn CPU-basiertes Autoscaling bereits für die Gruppe aktiviert ist, verwenden Sie den Befehl update-autoscaling, um den Vorhersage-Algorithmus zu aktivieren:

gcloud compute instance-groups managed update-autoscaling MIG_NAME \
  --cpu-utilization-predictive-method=optimize-availability

REST

Nehmen Sie beim Erstellen oder Aktualisieren des Autoscalings das Feld predictiveMethod in den Anfragetext mit einem der folgenden Werte auf:

OPTIMIZE_AVAILABILITY: zum Aktivieren des Vorhersage-Algorithmus
NONE (Standard): zum Deaktivieren des Vorhersage-Algorithmus

Wenn die Gruppe noch keine Autoscaling-Konfiguration hat, gehen Sie so vor:

Rufen Sie für eine regionale MIG die Methode regionAutoscalers.insert auf.
Rufen Sie für eine zonale MIG die Methode autoscalers.insert auf.

Wenn die Gruppe bereits eine Autoscaling-Konfiguration hat, gehen Sie so vor:

Rufen Sie für eine regionale MIG die Methode regionAutoscalers.patch auf.
Rufen Sie für eine zonale MIG die Methode autoscalers.patch auf.

Wenn CPU-basiertes Autoscaling für die Gruppe noch nicht aktiviert ist, müssen Sie es aktivieren.

Mit der folgenden Anfrage wird beispielsweise eine vorhandene Autoscaling-Ressource gepatcht, um CPU-basiertes Autoscaling mit den folgenden Einstellungen zu aktivieren:

Vorausschauendes Autoscaling aktiviert.
CPU-Zielauslastung von 75 %.
Die maximale Anzahl von Instanzen ist auf 20 gesetzt.
Ein Initialisierungszeitraum (coolDownPeriodSec) ist auf 5 Minuten festgelegt. Diese Einstellung weist das vorausschauende Autoscaling an, fünf Minuten vor der erwarteten Last zu skalieren, sodass Anwendungen beim Eintreffen der Last initialisiert werden.

PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/autoscalers/

{
  "name": "AUTOSCALER_NAME",
  "target": "https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME",
  "autoscalingPolicy": {
    "cpuUtilization": {
       "utilizationTarget": 0.75,
       "predictiveMethod": "OPTIMIZE_AVAILABILITY"
     },
    "maxNumReplicas": 20,
    "coolDownPeriodSec": 300
  }
}

Aktivierung von vorausschauendem Autoscaling prüfen

Informationen zum Anzeigen der aktuellen Autoscaling-Konfiguration einer MIG finden Sie unter Attribute einer MIG abrufen.

Vorausschauendes Autoscaling konfigurieren

Weitere Informationen zur Konfiguration der Zielauslastung, der Mindest- und Höchstzahl von Instanzen und der Initialisierungsphase finden Sie unter Anhand der CPU-Auslastung skalieren. Wenn Sie diese Optionen konfigurieren, versucht das vorausschauende Autoscaling alle Instanzen auf der von Ihnen festgelegten Zielauslastungsstufe zu erhalten, und zwar innerhalb des Bereichs der Mindest- und Höchstwerte der Gruppe, ebenso wie beim Echtzeit-Autoscaling.

Verwenden Sie die Einstellung für die Initialisierungsphase, um die Zeit bis zur Initialisierung der Anwendung zu berücksichtigen. Diese Einstellung beeinflusst, wie lange das vorausschauende Autoscaling neue Instanzen vor der vorhergesagten Erhöhung der Last startet, sodass Ihre Anwendung bereit ist, wenn die Last ankommt.

Eignung von vorausschauendem Autoscaling für Ihre Arbeitslast prüfen

Um zu sehen, ob das vorausschauende Autoscaling die Verfügbarkeit Ihrer Anwendung verbessern kann, können Sie die Leistung der aktuellen CPU-basierten Autoscaling-Konfiguration Ihrer Gruppe mit dem vorausschauenden Autoscaling vergleichen. Sie müssen das vorausschauende Autoscaling nicht aktivieren, um den Vergleich ausführen zu können.

Weitere Informationen zu Arbeitslasten, die für vorausschauendes Autoscaling geeignet sind, finden Sie unter Zustandsorientierte Arbeitslasten.

Auf Überlastungen prüfen

Die automatisch skalierte MIG ist überlastet, wenn die durchschnittliche CPU-Auslastung das Ziel überschreitet. Führen Sie die folgenden Schritte aus, um zu prüfen, ob Ihre Autoscaling-Konfiguration in den letzten 7 Tagen zu überlasteten VMs geführt hat und ob das vorausschauende Autoscaling die Überlastung reduzieren kann:

Rufen Sie in der Cloud Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen
Klicken Sie auf eine vorhandene MIG, für die CPU-basiertes Autoscaling konfiguriert ist. Die Übersichtsseite der Gruppe wird geöffnet.
Klicken Sie auf Bearbeiten.
Maximieren Sie im Abschnitt Autoscaling unter Messwerte für Autoscaling den Abschnitt CPU-Auslastung und klicken Sie dann auf Prüfen, ob vorausschauendes Autoscaling Ihre Verfügbarkeit optimieren kann.
Basierend auf den Daten der letzten sieben Tage zeigt die Tabelle, wie viele VMs pro Tag verwendet wurden und wie viele VMs pro Tag für die folgenden Zeilen überlastet wurden:
- Aktuelle Autoscaling-Konfiguration: Zeigt, welche Leistung das Autoscaling mit der aktuellen Konfiguration in den letzten sieben Tagen erzielt hat.
- Wenn das vorausschauende Autoscaling auf "Für Verfügbarkeit optimieren" gesetzt ist, sehen Sie, wie das Autoscaling abgeschnitten hätte, wenn das vorausschauende Autoscaling in den letzten sieben Tagen aktiv gewesen wäre.

Sie können die "Anzahl der pro Tag verwendeten VMs" als Proxy für Kosten verwenden. Um beispielsweise die Anzahl der überlasteten VMs zu reduzieren, erstellt das vorausschauende Autoscaling möglicherweise früher VMs und führt sie länger aus, was zu zusätzlichen Kosten führt.

Monitoring und Simulation von vorausschauendem Autoscaling

Sie können mit Cloud Monitoring die ehemalige Größe Ihrer Gruppe visualisieren. Die Monitoring-Grafik zeigt, wie Ihre Gruppe durch die Autoscaling-Konfiguration im Zeitverlauf skaliert wurde und wie ein aktives vorausschauendes Autoscaling Ihre Gruppe skaliert hätte.

Für Gruppen mit deaktiviertem vorausschauendem Autoscaling können Sie mit diesem Tool das vorausschauende Autoscaling simulieren, bevor Sie es aktivieren.

Rufen Sie in der Cloud Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen
Klicken Sie auf eine vorhandene MIG, für die CPU-basiertes Autoscaling konfiguriert ist. Die Übersichtsseite der Gruppe wird geöffnet.
Klicken Sie auf Monitoring, um Diagramme zur Gruppe anzuzeigen.
Klicken Sie im ersten Diagramm auf den Titel und wählen Sie Predictive Autoscaling aus. Hier sehen Sie die tatsächliche Größe der Gruppe sowie die vorhergesagte Größe der Gruppe.
Sie können einen anderen Zeitraum auswählen, um mehr Verlauf zu sehen oder einen Zeitraum zu vergrößern, in dem die Nachfrage gestiegen ist. So erkennen Sie, wie vorausschauendes Autoscaling die Gruppengröße vor der prognostizierten Last beeinflusst.

Funktionsweise des vorausschauenden Autoscalings

Das vorausschauende Autoscaling prognostiziert Ihren Skalierungsmesswert anhand der Verlaufstrends des Messwerts. Prognosen werden alle paar Minuten neu berechnet, sodass das Autoscaling seine Prognose schnell auf die letzten Änderungen der Überlastung anpasst. Das vorausschauende Autoscaling benötigt mindestens die Verlaufsdaten von 3 Tagen, um ein repräsentatives Nutzungsmuster für Vorhersagen zu erstellen, bevor es Vorhersagen liefern kann. Compute Engine benötigt bis zu 3 Wochen lange Lastverlaufsdaten einer MIG, um das Modell für maschinelles Lernen zu füllen.

Das vorausschauende Autoscaling berechnet die Anzahl der VMs, die Sie benötigen, um Ihr Nutzungsziel auf der Grundlage zahlreicher Faktoren zu erreichen. Dazu gehören:

Der prognostizierte zukünftige Wert des Skalierungsmesswerts
Der aktuelle Wert des Skalierungsmesswerts
Vertrauen in vergangene Trends, einschließlich vergangener Schwankungen des Skalierungsmesswerts
Die konfigurierte Initialisierungsphase der Anwendung, auch als Initialisierungsphase bezeichnet

Anhand dieser Faktoren skaliert das vorausschauende Autoscaling Ihre Gruppe vor der erwarteten Nachfrage.

Vergleich der Bereitstellung von VMs mit und ohne vorausschauende Autoscaling.

Abbildung 1. Vergleich der Bereitstellung von VMs mit und ohne vorausschauende Autoscaling.

In Abbildung 1 zeigt die blaue Linie eine steigende Nachfrage für VMs. Die schwarze Linie zeigt die Antwort des Autoscalings an: Es werden weitere VMs hinzugefügt. Bei Anwendungen mit langen Initialisierungszeiten hingegen zeigt die graue Linie, dass die hinzugefügten VMs mehr Zeit benötigen, bevor sie für die Bereitstellung bereit sind. Dies kann dazu führen, dass nicht genügend Bereitstellungs-VMs vorhanden sind, um den Bedarf zu decken. Wenn das vorausschauende Autoscaling aktiviert ist, werden der prognostizierte Anstieg der Nachfrage und die lange Ausführungszeit der Anwendung berücksichtigt: Das Autoscaling reagiert sofort auf das Hinzufügen von VMs, was zu einer ausreichenden Anzahl von Bereitstellungs-VMs führt. Sie können festlegen, wie lange neue Instanzen im Voraus hinzugefügt werden sollen, wenn Sie den Initialisierungsphase festlegen.

Nutzungsdaten in Echtzeit

Das vorausschauende Autoscaling kann kein Muster für alle zukünftigen Änderungen der Nutzung auf der Grundlage von Verlaufsdaten bestimmen, daher funktioniert es auch problemlos mit Echtzeitdaten. Ein unerwartetes Nachrichtenereignis könnte zum Beispiel zu einer Auslastung führen, die nicht anhand des Verlaufs vorhergesagt werden konnte. Zur Verarbeitung solcher unvorhersehbaren Änderungen der Last reagiert das vorausschauende Autoscaling folgendermaßen:

Es passt seine Vorhersagen an: Vorhersagen werden fortlaufend innerhalb weniger Minuten neu berechnet, sodass sie die neuesten Daten berücksichtigen. Das genaue Timing der Anpassung an neue Muster hängt unter anderem davon ab, wie oft sich das neue Muster wiederholt und wie groß der Unterschied zwischen dem neuen Muster und früheren Vorhersagen ist.
Es liefert Echtzeitdaten – die empfohlene Anzahl von Instanzen, die auf der Basis des Echtzeitwerts des Messwerts ermittelt werden, reicht immer aus, um die Zielauslastung der Gruppe zu erreichen. Wenn der aktuelle Wert eines Echtzeitsignals höher als die Vorhersage ist, hat der aktuelle Wert des Signals Vorrang vor der Vorhersage. Daher haben MIGs mit aktiviertem vorausschauendem Autoscaling immer eine höhere Verfügbarkeit als MIGs ohne vorausschauendes Autoscaling.

Zwei Diagramme zeigen, wie sich Vorhersagen an die tatsächliche CPU-Auslastung anpassen.

Abbildung 2. Zwei Diagramme zeigen, wie sich Vorhersagen an die tatsächliche CPU-Auslastung anpassen.

In Abbildung 2 zeigt die gestrichelte gelbe Linie die Vorhersage für t₁. Die tatsächliche CPU-Auslastung, wie sie durch die durchgezogene blaue Linie dargestellt wird, unterscheidet sich jedoch von der vorhergesagten Linie. Im linken Diagramm ist die tatsächliche CPU-Auslastung höher als vorhergesagt. Im rechten Diagramm ist die tatsächliche CPU-Auslastung niedriger als vorhergesagt. Die gestrichelte blaue Linie zeigt die angepasste Vorhersage an.

Kurze, unvorhersehbare Spitzen

Kurze, nicht vorhersehbare Spitzen werden in Echtzeit abgedeckt. Das Autoscaling erstellt mindestens so viele Instanzen wie nötig, um die Auslastung auf dem konfigurierten Ziel basierend auf dem aktuellen tatsächlichen Wert des Messwerts zu halten. Diese Instanzen werden jedoch nicht im Voraus erstellt, wie in der folgenden Abbildung dargestellt.

Eine kurze, nicht vorhersehbare Spitze führt dazu, dass das Autoscaling in Echtzeit reagiert.

Abbildung 3. Ein kurzer, unvorhersehbarer Anstieg führt dazu, dass das Autoscaling in Echtzeit reagiert.

In Abbildung 3 zeigt die durchgezogene blaue Linie die tatsächliche CPU-Auslastung an. Ein unerwarteter Anstieg der CPU-Nutzung konnte nicht vorhergesagt werden. Da das Autoscaling immer Echtzeitdaten prüft, fügt es Instanzen hinzu, um Spitzen zu berücksichtigen. Die durchgehend schwarze Linie deutet auf das reaktive Hinzufügen von VMs als Reaktion auf den Anstieg hin. Die durchgezogene graue Linie zeigt die Anzahl der Bereitstellungs-VMs. Die graue Linie verzögert die schwarze Linie aufgrund der Initialisierungszeit der Anwendung. In diesem Szenario ist die Gruppe vorübergehend überlastet.

Plötzlicher Rückgang

Ein weiterer, unvorhersehbarer Nutzungswechsel ist ein plötzlicher Rückgang, z. B. wenn ein Fehler im Rahmen des Anwendungspakets verursacht wird. In diesem Fall folgt die Anzahl der Instanzen zuerst der Prognose. Im Laufe der Zeit passt sich die Prognose jedoch an die jeweils niedrigere Nutzung an, was zu einer Skalierung führt. Der genaue Zeitpunkt dieser Anpassung hängt von zahlreichen Faktoren ab, z. B. wie oft das Muster in der Vergangenheit aufgetreten ist, wie lange der Rückgang dauert und wie tief er ist.

Ein plötzlicher Rückgang führt dazu, dass das vorausschauende Autoscaling die Prognose ändert.

Abbildung 4. Ein plötzlicher Rückgang führt dazu, dass das vorausschauende Autoscaling die Prognose ändert.

In Abbildung 4 zeigt die gestrichelte gelbe Linie die Vorhersage für t₁. Die tatsächliche CPU-Auslastung, wie sie durch die durchgehende blaue Linie dargestellt wird, ist jedoch niedriger als vorhergesagt. Die gestrichelte blaue Linie zeigt die aktualisierte Vorhersage an, die automatisch angepasst wurde, nachdem eine geringere prognostizierten Auslastung beobachtet wurde. Dies führt dazu, dass das Autoscaling Instanzen nach dem standardmäßigen Stabilisierungszeitraum entfernt.

Verlaufsdaten

Für vorausschauendes Autoscaling sind mindestens 3 Tage Lastverlaufsdaten erforderlich, um eine Prognose zu erstellen. Wenn Sie eine neue MIG haben, die keine Verlaufsdaten enthält, skaliert Compute Engine Ihre Gruppe reaktiv mit Echtzeitdaten, bis genügend Verlaufsdaten verfügbar sind. Nach drei Tagen, wenn Compute Engine zusätzliche Nutzungsdaten gesammelt hat, verbessern sich die Vorhersagen.

Wenn Sie Ihre Anwendung aktualisieren, indem Sie eine neue MIG erstellen und die alte löschen (z. B. eine Blau/Grün-Bereitstellung), benötigt die neue MIG Verlaufsdaten über drei Tage, bevor mit dem vorausschauenden Autoscaling Prognosen generiert werden können. Wenn Sie die Lastverlaufsdaten für alle MIGs beibehalten möchten, damit Prognosen sofort beim Erstellen einer neuen MIG gestartet werden können, kontaktieren Sie uns, um eine Anleitung zum Verknüpfen einer privaten Vorschau anzufordern.

Nächste Schritte

Autoscalings verwalten
Autoscaling-Entscheidungen treffen
Mit mehreren Autoscaling-Signalen Gruppen skalieren.