Verwaltetes Autoscaling

Auf dieser Seite wird die Funktionsweise des verwalteten Autoscalings sowie die Kosten und bei der Verwendung des verwalteten Autoscalings. Es bietet auch Informationen für helfen Ihnen dabei, das verwaltete Autoscaling zu konfigurieren.

Funktionsweise des verwalteten Autoscalings

Wenn Sie den verwalteten Autoscaler aktivieren, passt Spanner automatisch die Größe Ihrer Instanz an. Die Funktion „Verwaltete Autoscaler“ reagiert auf Änderungen bei der Arbeitslast oder den Speicheranforderungen Ihrer Instanz, wenn sich die Last erhöht oder verringert. Beim verwalteten Autoscaling wird entweder vertikal skaliert, wodurch Rechenkapazität hinzugefügt wird. oder herunterskaliert und dadurch Rechenkapazität aus der Instanz entfernt wird.

Wenn Sie das verwaltete Autoscaling konfigurieren, können Sie entweder Verarbeitungseinheiten für kleine Instanzen oder Knoten für große Instanzen. In diesem Dokument wird der Begriff Rechenkapazität für Knoten oder Verarbeitungseinheiten verwendet.

Das verwaltete Autoscaling von Spanner bestimmt, ist eine Kapazität erforderlich, basierend auf Folgendem:

  • CPU-Auslastungsziel mit hoher Priorität
  • Speicherauslastungsziel
  • Mindestgrenze
  • Maximales Limit

Jede Skalierungsdimension generiert eine empfohlene Instanzgröße. Spanner verwendet automatisch die höchste Instanzgröße. Das bedeutet, Wenn Ihre Instanz beispielsweise 10 Knoten benötigt, um die Speicherauslastung zu erreichen, aber 12 Knoten, um das CPU-Auslastungsziel zu erreichen, Spanner die Instanz auf 12 Knoten skaliert.

Wenn sich die Rechenkapazität ändert, kann Spanner kontinuierlich optimiert den Speicher. Dabei werden die Daten auf alle Server neu verteilt, um sicherzustellen, dass der Traffic gleichmäßig verteilt ist und kein einzelner Server überlastet wird. Weitere Informationen finden Sie unter Einschränkungen.

Wenn der verwaltete Autoscaler eine Instanz auf ihr maximales Limit hochskaliert, die Arbeitslast aber weiterhin zu einer höheren CPU-Auslastung als das Ziel führt, können Arbeitslastanfragen eine höhere Latenz aufweisen oder fehlschlagen. Wenn eine Instanz bis zu ihrem maximalen Rechenkapazitätsziel skaliert aber die Arbeitslast benötigt mehr Speicher als das maximale Speicherlimit, schreiben Sie -Anfragen fehlschlagen können. Ob das maximale Ziel erreicht wurde, können Sie anhand der Systemereignisprotokolle des verwalteten Autoscaling in der Google Cloud Console auf der Seite Systemstatistiken sehen. Weitere Informationen finden Sie unter Speicherlimits.

Wenn Spanner eine Instanz herunterskaliert, wird die Rechenkapazität langsamer entfernt als beim Hochskalieren, um Auswirkungen auf die Latenz zu reduzieren.

Kosten

Die Gesamtkosten für Spanner können niedriger oder höher sein, je nachdem, wie Sie Ihre Spanner-Instanz vor der Aktivierung des verwalteten Autoscalers konfiguriert haben und welche Limits Sie für den verwalteten Autoscaler festgelegt haben.

Wenn Sie Ihre Spanner-Instanz beispielsweise manuell so konfiguriert haben, dass sie jederzeit genügend Rechenkapazität für Spitzenarbeitslasten hat, sind Ihre Kosten mit dem verwalteten Autoscaler möglicherweise niedriger, da die Rechenkapazität reduziert wird, wenn die Instanz inaktiv ist.

Wenn Sie Ihre Spanner-Instanz bisher manuell so konfiguriert haben, genügend Rechenkapazität für durchschnittliche Arbeitslasten und Verschlechterungen der Gesamtleistung Wenn der Arbeitslast-Traffic steigt, werden Ihre Kosten mit dem verwalteten Autoscaling kann höher sein, da das verwaltete Autoscaling die Rechenkapazität erhöhen kann wenn die Instanz ausgelastet ist. Dies bietet Ihren Nutzern jedoch eine gleichmäßigere Leistung.

Sie können die maximalen Kosten Ihrer Spanner-Instanz begrenzen indem Sie die maximale Anzahl von Knoten oder Verarbeitungseinheiten auf die gewünschte Stufe ausgeben möchten.

Beschränkungen

Wenn Sie die Funktion für die verwaltete automatische Skalierung für eine Instanz aktivieren oder ändern, gelten die folgenden Einschränkungen:

  • Sie können keine Instanz verschieben, wenn der verwaltete Autoscaling-Funktion aktiviert ist. Sie müssen zuerst den verwalteten Autoscaler deaktivieren und dann die Instanz verschieben. Nachdem Sie die Instanz verschoben haben, können Sie den verwalteten Autoscaler wieder aktivieren.
  • Sie müssen das Minimallimit für die Autoscaling-Instanz auf 1.000 festlegen Verarbeitungseinheiten oder größer oder 1 Knoten oder mehr.
  • Wenn Sie Autoscaling auf einer vorhandenen Instanz aktivieren, wird die vorhandene Instanz Die Kapazität kann unter dem Mindestwert liegen, den Sie für das verwaltete Autoscaling konfigurieren. Die Instanz wird jedoch beim Starten automatisch auf den konfigurierten Mindestwert hochskaliert. Wenn Ihre Instanz z. B. einen Knoten hat, Sie aber den Mindestwert auf zwei Knoten setzen, wird beim Start der Instanz wird automatisch auf 2 Knoten skaliert.

Parameter für verwaltetes Autoscaling

Wenn Sie eine Instanz erstellen oder bearbeiten und das verwaltete Autoscaling aktivieren, definieren Sie die Werte in der folgenden Tabelle.

Parameter Beschreibung
CPU-Auslastungsziel mit hoher Priorität Ein Prozentsatz der CPU-Kapazität mit hoher Priorität der Instanz. Dieser Wert muss zwischen 10% und 90 % liegen. Wenn die CPU-Auslastung einer Instanz das von Ihnen festgelegte Ziel überschreitet, fügt Spanner der Instanz sofort Rechenkapazität hinzu. Wenn die CPU-Auslastung wesentlich niedriger als das Ziel ist, entfernt Spanner Rechenkapazität. Eine Anleitung finden Sie unter CPU-Auslastungsziel bestimmen.
Speicherauslastungsziel Der Prozentsatz des Speicherplatzes auf einem Knoten, den Sie nutzen können, bevor Spanner hochskaliert. Dieses Ziel stellt sicher, dass Sie genügend Rechenkapazität vorhanden ist, um Schwankungen in der Datenmenge zu bewältigen. Dieser Wert muss zwischen 10 und 99 % liegen. Eine Anleitung finden Sie unter Ziel der Speicherauslastung bestimmen.
Mindestgrenze Die niedrigste Rechenkapazität, auf die Spanner die Instanz herunterskaliert. Der Mindestwert darf nicht unter 10 % des Werts liegen, den Sie für das Höchstlimit festgelegt haben. Beispiel: Wenn die Höchstgrenze 40 Knoten beträgt, muss die Mindestgrenze mindestens 4 betragen Knoten. Die Anforderung von 10 % ist eine feste Beschränkung. Weitere Informationen finden Sie unter Mindestlimit festlegen.
Maximales Limit Die höchste Rechenkapazität, die Spanner skaliert bis zur Instanz. Für Knoten muss dieser Wert größer als 1 Knoten (oder 1.000 Verarbeitungseinheiten) und größer oder gleich der Mindestanzahl an Knoten oder Verarbeitungseinheiten. Der Wert darf nicht mehr als das Zehnfache des Zahl, die Sie für die Mindestmenge an Rechenkapazität wählen. Diese 10 ist eine feste Begrenzung. Weitere Informationen finden Sie unter Höchstgrenze ermitteln.

Verwaltetes Autoscaling konfigurieren

In diesem Abschnitt wird beschrieben, wie Sie festlegen, welche Nummern für Ihre verwalteten automatisch skalieren. Nachdem Sie die Anfangswerte festgelegt haben, Ihre Instanz überwachen und bei Bedarf die Zahlen anpassen.

CPU-Auslastungsziel bestimmen

Das optimale Ziel für Ihre Instanz hängt von den Latenz- und Durchsatzanforderungen Ihrer Arbeitslast ab. Empfehlungen zur maximalen CPU-Auslastung für regionale, zweiregionale und multiregionale Instanzkonfigurationen finden Sie unter Benachrichtigungen für eine hohe CPU-Auslastung.

Im Allgemeinen sollten Sie, wenn Sie eine inakzeptabel hohe Latenz beobachten, das CPU-Auslastungsziel verringern.

Ziel der Speicherauslastung bestimmen

Beim Autoscaling wird das Speicherauslastungsziel als Prozentsatz pro Knoten. Bei Instanzen mit mindestens 1 Knoten (1.000 Verarbeitungseinheiten) ist auf 4 TB pro Knoten begrenzt.

Höchstgrenze festlegen

Der Wert, den Sie für die maximale Rechenkapazität auswählen, entspricht der Rechenkapazität, die die Instanz für die Verarbeitung des größten Traffics benötigt, auch wenn Sie nicht erwarten, dass dieses Volumen oft erreicht wird. Spanner kann nie auf eine höhere Rechenkapazität hochskaliert werden als Anforderungen. Sie können sich diese Zahl auch als die höchste Rechenmenge für die Sie zu zahlen bereit sind. Weitere Informationen zu den zulässigen Werten finden Sie unter Autoscaler-Parameter.

Das Limit muss sowohl das CPU-Auslastungsziel als auch das Speicherauslastungsziel, das Sie für das Autoscaling festgelegt haben.

  • Instanz von manueller Zuweisung in verwaltet ändern Autoscaling, um die höchste Rechenkapazität zu finden, die die Instanz in den letzten ein oder zwei Monaten. Ihr Maximum für das verwaltete Autoscaling sollte mindestens so hoch sein.

  • Wenn Sie den verwalteten Autoscaler für eine neue Instanz aktivieren, sehen Sie sich die Messwerte anderer Instanzen an und verwenden Sie diese als Orientierungshilfe, wenn Sie das maximale Limit festlegen.

  • Wenn Sie eine neue Arbeitslast haben und nicht sicher sind, wie sie wachsen wird, können Sie die Menge an Rechenkapazität schätzen, die Sie zum Erreichen des integrierten Speicherauslastungsziels benötigen, und passen die Zahl später an.

Sie müssen auch wissen, wie viel Kontingent auf Ihrem Knoten verbleibt, da die Funktion Das verwaltete Autoscaling kann Ihre Instanz nicht für mehr Rechenkapazität konfigurieren als Ihr Kontingent. Weitere Informationen finden Sie unter Knotenlimits.

Sobald die Instanz einsatzbereit und die automatische Skalierung aktiviert ist, überwachen Sie die Instanz und achten Sie darauf, dass der Wert für das maximale Limit mindestens so hoch wie das empfohlene Limit für das CPU-Ziel und das empfohlene Limit für das Speicherziel ist.

Untergrenze festlegen

Sie legen ein Mindestlimit für den verwalteten Autoscaler fest, damit Ihre Spanner-Instanz auf die kleinste, kostengünstigste Größe herunterskaliert werden kann. Spanner verhindert automatisch, dass die Knotenanzahl unter den Mindestwert fällt, der für die CPU- und Speicherauslastungsziele erforderlich ist.

Der kleinste Minimalwert, den das verwaltete Autoscaling zulässt, ist 1 Knoten oder 1.000 Verarbeitungseinheiten. Wenn Sie Autoscaling für eine vorhandene Instanz aktivieren, unter dem für das verwaltete Autoscaling konfigurierten Mindestwert liegt, wird die Instanz beim Start automatisch bis zu diesem Minimum skaliert.

Nachdem Sie die Instanz mit verwaltetem Autoscaling gestartet haben, sollten Sie eine um sicherzustellen, dass die Mindestgröße funktioniert. Sie sollten um sicherzustellen, dass er weiterhin wie erwartet funktioniert.

Weitere Informationen zu zulässigen Werten finden Sie in diesem Dokument unter Parameter für verwalteten Autoscaler.

In vielen Fällen ist es sinnvoll, den Mindestwert auf mehr als 1 zu setzen. Wählen Sie in folgenden Fällen eine höhere Zahl oder ein höheres Mindestlimit an:

  • Ein Spitzenereignis steht bevor, wenn der Traffic voraussichtlich vorübergehend ansteigen und sicherstellen, dass genügend Rechenleistung Kapazität.
  • Ihre Anwendung sendet Daten mit deutlichen Traffic-Spitzen. Wenn Sie neue Rechenkapazität hinzufügen, wird Spanner automatisch neu ausbalanciert, um die neuen Knoten oder Verarbeitungseinheiten zu verwenden. Da dieser Vorgang einige Minuten dauern kann, einen eher konservativen Ansatz wählen Minimum Auf diese Weise kann Ihre Instanz Spitzen nahtlos bewältigen.
  • Sie erhöhen die maximale Rechenkapazität. Die Mindestanzahl muss immer zehn sein Prozentsatz oder kleiner des Ziels für die maximale Rechenkapazität. Wenn Sie beispielsweise Legen Sie die maximale Anzahl von Knoten auf 30 fest. Sie müssen die Mindestanzahl von Knoten auf mindestens 3.

Wenn Sie den Wert für die minimale Rechenkapazität einer Instanz erhöhen, Spanner versucht sofort, die Instanz auf den neuen Minimum Es gelten die standardmäßigen Einschränkungen. Wenn Ihr Kontingent aufgebraucht ist, schlägt der Antrag auf Änderung der Konfiguration des verwalteten Autoskalators fehl und die Konfiguration wird nicht aktualisiert.

Parameter-Flags und Einschränkungen der Google Cloud CLI

Wenn Sie das verwaltete Autoscaling über die Google Cloud CLI konfigurieren, gibt es einige Flags, die Sie festlegen müssen. Mit optionalen Flags geben Sie an, ob Sie Knoten oder Verarbeitungseinheiten verwenden möchten. Weitere Informationen zu Erstellen einer neuen Instanz mit verwaltetem Autoscaling oder für das Autoscaling einer vorhandenen Instanz, finden Sie hier:

Die folgenden Flags sind erforderlich, wenn Sie das verwaltete Autoscaling auf Ihrem Instanz:

  • autoscaling-high-priority-cpu-percent
  • autoscaling-storage-percent

Wenn Sie Knoten verwenden, müssen Sie auch beide der folgenden Flags verwenden, wenn Sie den verwalteten Autoscaler aktivieren:

  • autoscaling-min-nodes
  • autoscaling-max-nodes

Wenn Sie sich für Verarbeitungseinheiten entscheiden, müssen Sie auch die beiden folgenden Flags, wenn Sie das verwaltete Autoscaling aktivieren:

  • autoscaling-min-processing-units
  • autoscaling-max-processing-units

Beim Hinzufügen des verwalteten Autoscalings zu einer vorhandene Instanz mit der Google Cloud CLI:

  • Das Flag --nodes kann nicht mit den Flags --autoscaling-min-nodes oder --autoscaling-max-nodes verwendet werden, da mit --nodes eine bestimmte Anzahl von Knoten und kein Skalierungsbereich festgelegt wird. Ebenso können Sie das Flag --processing-units nicht mit den Flags autoscaling-min-processing-units oder autoscaling-max-processing-units verwenden, da mit --processing-units eine bestimmte Anzahl von Verarbeitungseinheiten und nicht ein Skalierungsbereich festgelegt wird.
  • Die Flags für Knoten und Verarbeitungseinheiten dürfen nicht kombiniert werden. Sie können beispielsweise --autoscaling-max-nodes nicht mit autoscaling-min-processing-units kombinieren.

Einstellungen optimieren

Achten Sie auf die Nutzung der Rechenkapazität und passen Sie bei Bedarf die Einstellungen an, insbesondere nach der ersten Aktivierung des verwalteten Autoscalings. Wir empfehlen, die Seite System Insights in der Google Cloud Console zu verwenden.

Zugriffssteuerung

Zum Konfigurieren des verwalteten Autoscalings müssen Sie ein Hauptkonto mit einer Rolle mit den Berechtigungen zum Erstellen und Aktualisieren für die Instanz haben, die Sie konfigurieren.

Monitoring

Spanner bietet mehrere Messwerte, mit denen Sie nachvollziehen können, wie gut der verwaltete Autoscaler funktioniert, wenn er entsprechend den Arbeitslastanforderungen hoch- und herunterskaliert. Anhand der Messwerte können Sie auch beurteilen, ob Ihre Einstellungen optimal sind, um die Arbeitslast- und Kostenanforderungen Ihres Geschäfts zu erfüllen. Wenn Sie beispielsweise feststellen, dass die Knotenanzahl für eine Instanz häufig nahe an der maximalen Anzahl von Knoten ist, sollten Sie die maximale Anzahl vielleicht erhöhen. Weitere Informationen über Monitoring Ihrer Spanner-Ressourcen finden Sie unter Instanzen mit Cloud Monitoring überwachen

Die folgenden Messwerte sind in Grafiken in den Systemstatistiken in der Google Cloud Console. Sie können diese Messwerte auch mit Cloud Monitoring anzeigen lassen.

  • spanner.googleapis.com/instance/autoscaling/min_node_count
  • spanner.googleapis.com/instance/autoscaling/max_node_count
  • spanner.googleapis.com/instance/autoscaling/min_processing_units
  • spanner.googleapis.com/instance/autoscaling/max_processing_units
  • spanner.googleapis.com/instance/autoscaling/high_priority_cpu_target_utilization
  • spanner.googleapis.com/instance/autoscaling/storage_target_utilization

Logging

Spanner erstellt jedes Mal ein Audit-Log für Systemereignisse, wenn ein Instanz.

Sie können sich die Systemereignisprotokolle des verwalteten Autoscalers in der Google Cloud Console auf der Seite Systemstatistiken ansehen.

Sie können Logs auch mit dem Log-Explorer ansehen:

  1. Öffnen Sie in der Google Cloud Console den Log-Explorer:

    Zu „Log-Explorer“

  2. Wählen Sie das entsprechende Google Cloud-Projekt aus.

  3. Geben Sie im Feld Query Folgendes ein:

     protoPayload.methodName="AutoscaleInstance"
    

    Sie können die folgende Abfrage hinzufügen, um die Logs weiter einzugrenzen:

    resource.type="spanner_instance"
    resource.labels.instance_id=INSTANCE_ID
    resource.labels.project_id=PROJECT_ID
    logName="projects/span-cloud-testing/logs/cloudaudit.googleapis.com%2Fsystem_event"
    protoPayload.methodName="AutoscaleInstance"
  4. Klicken Sie auf Abfrage ausführen.

Im Bereich Abfrageergebnisse werden die Logs der letzten Stunde angezeigt.

Weitere Informationen zum Anzeigen von Logs finden Sie unter Cloud Logging. Sie können logbasierte Benachrichtigungen einrichten. auf der Seite Log-Explorer in Google Cloud oder mithilfe der Methode Cloud Monitoring API

Nächste Schritte