Verwaltetes Autoscaling

Auf dieser Seite wird die Funktionsweise des verwalteten Autoscalings sowie die Kosten und bei der Verwendung des verwalteten Autoscalings. Es bietet auch Informationen für helfen Ihnen dabei, das verwaltete Autoscaling zu konfigurieren.

Funktionsweise des verwalteten Autoscalings

Wenn Sie das verwaltete Autoscaling aktivieren, passt Spanner die die Größe Ihrer Instanz. Die verwaltete Autoscaling-Funktion reagiert auf Änderungen je nach Arbeitslast oder Speicherbedarf Ihrer Instanz. Das verwaltete Autoscaling skaliert oder herunterskaliert und dadurch Rechenkapazität aus der Instanz entfernt wird.

Wenn Sie das verwaltete Autoscaling konfigurieren, können Sie entweder Verarbeitungseinheiten für kleine Instanzen oder Knoten für große Instanzen. In diesem Dokument wird der Begriff Rechenkapazität mit Knoten oder Verarbeitungseinheiten.

Das verwaltete Autoscaling von Spanner bestimmt, ist eine Kapazität erforderlich, basierend auf Folgendem:

  • CPU-Auslastungsziel mit hoher Priorität
  • Speicherauslastungsziel
  • Mindestgrenze
  • Maximales Limit

Jede Skalierungsdimension generiert eine empfohlene Instanzgröße. Spanner verwendet automatisch die höchste. Das bedeutet, dass Wenn Ihre Instanz beispielsweise 10 Knoten benötigt, um die Speicherauslastung zu erreichen, aber 12 Knoten, um das CPU-Auslastungsziel zu erreichen, Spanner die Instanz auf 12 Knoten skaliert.

Wenn sich die Rechenkapazität ändert, kann Spanner kontinuierlich optimiert den Speicher. Die Daten werden auf allen Servern neu verteilt. um sicherzustellen, dass der Traffic gleichmäßig verteilt und kein einzelner Server überlastet wird. Weitere Informationen finden Sie unter Einschränkungen.

Wenn das verwaltete Autoscaling eine Instanz bis zu ihrem Limit skaliert, der verursacht immer noch eine höhere CPU-Auslastung dem Ziel entsprechen, können Arbeitslastanfragen einen höheren oder scheitern. Wenn eine Instanz bis zu ihrem maximalen Rechenkapazitätsziel skaliert aber die Arbeitslast benötigt mehr Speicher als das maximale Speicherlimit, schreiben Sie -Anfragen fehlschlagen können. Wenn Sie wissen möchten, ob das maximale Ziel erreicht wurde, können Sie Systemereignislogs des verwalteten Autoscalings in der Google Cloud Console auf der Seite Systemstatistiken: Weitere Informationen finden Sie unter Speicherlimits.

Wenn Spanner eine Instanz herunterskaliert, wird Rechenkapazität entfernt langsamer als beim Hochskalieren, um die Auswirkungen auf die Latenz zu reduzieren.

Kosten

Ihre Gesamtkosten für Spanner können niedriger oder höher sein, je nachdem, wie Sie Ihre Spanner-Instanz konfiguriert haben, das verwaltete Autoscaling und die für das verwaltete Autoscaling festgelegten Limits.

Wenn Sie z. B. Spanner manuell konfiguriert haben, um genügend Rechenkapazität für Spitzenarbeitslasten zu haben. können Ihre Kosten mit dem verwalteten Autoscaling niedriger sein, wenn die Instanz inaktiv ist.

Wenn Sie Ihre Spanner-Instanz bisher manuell so konfiguriert haben, genügend Rechenkapazität für durchschnittliche Arbeitslasten und Verschlechterungen der Gesamtleistung Wenn der Arbeitslast-Traffic steigt, werden Ihre Kosten mit dem verwalteten Autoscaling kann höher sein, da das verwaltete Autoscaling die Rechenkapazität erhöhen kann wenn die Instanz ausgelastet ist. Dies bietet Ihren Nutzern jedoch mehr eine konsistente Leistung zu erzielen.

Sie können die maximalen Kosten Ihrer Spanner-Instanz begrenzen indem Sie die maximale Anzahl von Knoten oder Verarbeitungseinheiten auf die gewünschte Stufe ausgeben möchten.

Beschränkungen

Die folgenden Einschränkungen gelten, wenn Sie die verwalteten Autoscaling-Funktion auf einer Instanz:

  • Sie können keine Instanz verschieben, wenn der verwaltete Autoscaling-Funktion aktiviert ist. Sie müssen zuerst die verwalteten und die Instanz dann verschieben. Nachdem Sie die Instanz verschoben haben, können Sie das verwaltete Autoscaling wieder zu aktivieren.
  • Sie müssen das Minimallimit für die Autoscaling-Instanz auf 1.000 festlegen Verarbeitungseinheiten oder größer oder 1 Knoten oder mehr.
  • Wenn Sie Autoscaling auf einer vorhandenen Instanz aktivieren, wird die vorhandene Instanz Die Kapazität kann unter dem Mindestwert liegen, den Sie für das verwaltete Autoscaling konfigurieren. Die Instanz wird jedoch automatisch auf das konfigurierte Minimum skaliert. wenn Sie ihn starten. Wenn Ihre Instanz z. B. einen Knoten hat, Sie aber den Mindestwert auf zwei Knoten setzen, wird beim Start der Instanz wird automatisch auf bis zu 2 Knoten skaliert.

Verwaltete Autoscaling-Parameter

Wenn Sie eine Instanz erstellen oder bearbeiten und das verwaltete Autoscaling aktivieren, definieren Sie die Werte in der folgenden Tabelle.

Parameter Beschreibung
CPU-Auslastungsziel mit hoher Priorität Ein Prozentsatz der CPU-Kapazität mit hoher Priorität der Instanz. Dieser Wert muss zwischen 10% und 90 % liegen. Wenn die CPU-Auslastung einer Instanz den festgelegt haben, fügt Spanner sofort Compute Engine- Kapazität für die Instanz. Wenn die CPU-Auslastung deutlich niedriger ist als entfernt Spanner die Rechenkapazität. Zur Orientierung: Siehe Bestimmen Sie das CPU-Auslastungsziel.
Speicherauslastungsziel Der Prozentsatz des Speichers auf einem Knoten, den Sie vor dem Spanner skaliert hoch. Dieses Ziel stellt sicher, dass Sie genügend Rechenkapazität vorhanden ist, um Schwankungen in der Datenmenge zu bewältigen. Dieser Wert muss zwischen 10 und 99 % liegen. Weitere Informationen finden Sie unter Bestimmen Sie das Speicherauslastungsziel.
Mindestgrenze Die niedrigste Rechenkapazität, die Spanner skaliert die Instanz herunter. Der Minimalwert darf nicht unter 10% des für den Höchstwert festgelegten Werts liegen. Beispiel: Wenn die Höchstgrenze 40 Knoten beträgt, muss die Mindestgrenze mindestens 4 betragen Knoten. Die Anforderung von 10 % ist eine feste Beschränkung. Für Weitere Informationen
Maximales Limit Die höchste Rechenkapazität, die Spanner skaliert bis zur Instanz. Für Knoten muss dieser Wert größer als 1 Knoten (oder 1.000 Verarbeitungseinheiten) und größer oder gleich der Mindestanzahl an Knoten oder Verarbeitungseinheiten. Der Wert darf nicht mehr als das Zehnfache des Zahl, die Sie für die Mindestmenge an Rechenkapazität wählen. Diese 10 ist eine feste Begrenzung. Weitere Informationen finden Sie unter Bestimmen Sie die Obergrenze.

Verwaltetes Autoscaling konfigurieren

In diesem Abschnitt wird beschrieben, wie Sie festlegen, welche Nummern für Ihre verwalteten automatisch skalieren. Nachdem Sie die Anfangswerte festgelegt haben, Ihre Instanz überwachen und bei Bedarf die Zahlen anpassen.

CPU-Auslastungsziel bestimmen

Das optimale Ziel für Ihre Instanz hängt von der Latenz und dem Durchsatz ab Anforderungen Ihrer Arbeitslast. Um unsere Empfehlungen für maximale CPU-Nutzung anzusehen für regionale, duale und multiregionale Instanzkonfigurationen finden Sie unter Warnungen bei hoher CPU-Auslastung.

Im Allgemeinen sollten Sie, wenn Sie eine inakzeptabel hohe Latenz beobachten, das CPU-Auslastungsziel verringern.

Ziel der Speicherauslastung bestimmen

Beim Autoscaling wird das Speicherauslastungsziel als Prozentsatz pro Knoten. Bei Instanzen mit mindestens 1 Knoten (1.000 Verarbeitungseinheiten) ist auf 4 TB pro Knoten begrenzt.

Höchstgrenze festlegen

Der Wert, den Sie als maximale Rechenkapazität auswählen, ist gleich die Rechenkapazität, die die Instanz benötigt, um die meisten Zugriffe haben, auch wenn Sie im Lauf der Zeit nicht erwarten, dieses Volumen zu erreichen . Spanner kann nie auf eine höhere Rechenkapazität skaliert werden als Anforderungen. Sie können sich diese Zahl auch als die höchste Rechenmenge für die Sie zu zahlen bereit sind. Weitere Informationen finden Sie unter Autoscaling-Parameter mit Details zu zulässigen Werten.

Das Limit muss sowohl das CPU-Auslastungsziel als auch das Speicherauslastungsziel, das Sie für das Autoscaling festgelegt haben.

  • Instanz von manueller Zuweisung in verwaltet ändern Autoscaling, um die höchste Rechenkapazität zu finden, die die Instanz in den letzten ein oder zwei Monaten. Ihr Maximum für das verwaltete Autoscaling sollte mindestens so hoch sein.

  • Wenn Sie das verwaltete Autoscaling für eine neue Instanz aktivieren, aus anderen Instanzen zu erstellen und sie als Anhaltspunkt zu verwenden, wenn Sie der Höchstgrenze.

  • Wenn Sie eine neue Arbeitslast haben und nicht sicher sind, wie sie wachsen wird, die Rechenkapazität abschätzen, die Sie benötigen, um das eingebaute Speicherauslastungsziel und die Anzahl später anpassen.

Sie müssen auch wissen, wie viel Kontingent auf Ihrem Knoten verbleibt, da die Funktion Das verwaltete Autoscaling kann Ihre Instanz nicht für mehr Rechenkapazität konfigurieren als Ihr Kontingent. Weitere Informationen finden Sie unter Knotenlimits.

Sobald die Instanz mit aktiviertem Autoscaling gelaufen ist, überwachen Sie die Instanz und achten Sie darauf, dass der Wert, den Sie für Das Limit ist mindestens so hoch wie das empfohlene Limit für das CPU-Ziel und dem empfohlenen Limit für das Speicherziel.

Untergrenze festlegen

Sie legen eine Untergrenze für das verwaltete Autoscaling fest, Die Spanner-Instanz kann bis auf die kleinsten, eine kosteneffiziente Größe. Spanner verhindert automatisch, dass der Knoten Anzahl der Elemente, die unter das Minimum fallen, das für die Beibehaltung von CPU und Speicher erforderlich ist Nutzungsziele.

Der kleinste Minimalwert, den das verwaltete Autoscaling zulässt, ist 1 Knoten oder 1.000 Verarbeitungseinheiten. Wenn Sie Autoscaling für eine vorhandene Instanz aktivieren, unter dem für das verwaltete Autoscaling konfigurierten Mindestwert liegt, wird die Instanz beim Start automatisch bis zu diesem Minimum skaliert.

Nachdem Sie die Instanz mit verwaltetem Autoscaling gestartet haben, sollten Sie eine um sicherzustellen, dass die Mindestgröße funktioniert. Sie sollten um sicherzustellen, dass sie weiterhin wie erwartet funktioniert.

Weitere Informationen zu zulässigen Werten finden Sie unter Verwaltete Autoscaling-Parameter in diesem Dokument

Häufig möchten Sie den Mindestwert auf mehr als eins setzen. Wählen Sie in folgenden Fällen eine höhere Zahl oder ein höheres Mindestlimit an:

  • Ein Spitzenereignis steht bevor, wenn der Traffic voraussichtlich vorübergehend erhöht werden und Sie sichergehen möchten, Kapazität.
  • Ihre Anwendung sendet Daten mit deutlichen Traffic-Spitzen. Wenn Sie neue Rechenkapazität hinzufügen, Spanner führt das Gleichgewicht automatisch aus, um die neuen Knoten oder Verarbeitungseinheiten. Da dieser Vorgang einige Minuten dauern kann, einen eher konservativen Ansatz wählen Minimum Auf diese Weise kann Ihre Instanz Spitzen nahtlos bewältigen.
  • Sie erhöhen die maximale Rechenkapazität. Die Mindestanzahl muss immer zehn sein Prozentsatz oder kleiner des Ziels für die maximale Rechenkapazität. Wenn Sie beispielsweise Legen Sie die maximale Anzahl von Knoten auf 30 fest. Sie müssen die Mindestanzahl an Knoten auf mindestens 3.

Wenn Sie den Wert für die minimale Rechenkapazität einer Instanz erhöhen, Spanner versucht sofort, die Instanz auf den neuen Minimum Die Standardeinschränkungen angewendet werden. Wenn das Kontingent ausgeschöpft ist, die Konfiguration fehlschlägt und die Konfiguration nicht aktualisiert wird.

Parameter-Flags und Einschränkungen der Google Cloud CLI

Wenn Sie das verwaltete Autoscaling über die Google Cloud CLI konfigurieren, gibt es einige Flags, die Sie festlegen müssen. Mit optionalen Flags geben Sie an, ob Sie Knoten oder Verarbeitungseinheiten verwenden möchten. Weitere Informationen zu Erstellen einer neuen Instanz mit verwaltetem Autoscaling oder eine vorhandene Instanz automatisch skalieren, finden Sie hier:

Die folgenden Flags sind erforderlich, wenn Sie das verwaltete Autoscaling auf Ihrem Instanz:

  • autoscaling-high-priority-cpu-percent
  • autoscaling-storage-percent

Wenn Sie Knoten nutzen, müssen Sie auch die beiden folgenden Flags verwenden, wenn aktivieren Sie das verwaltete Autoscaling:

  • autoscaling-min-nodes
  • autoscaling-max-nodes

Wenn Sie sich für Verarbeitungseinheiten entscheiden, müssen Sie auch die beiden folgenden Flags, wenn Sie das verwaltete Autoscaling aktivieren:

  • autoscaling-min-processing-units
  • autoscaling-max-processing-units

Beim Hinzufügen des verwalteten Autoscalings zu einer vorhandene Instanz mit der Google Cloud CLI:

  • Sie können das Flag --nodes nicht mit dem --autoscaling-min-nodes- oder --autoscaling-max-nodes-Flags, da mit --nodes eine bestimmte Anzahl von Knoten und nicht einen Skalierungsbereich. Ebenso können Sie die Methode --processing-units mit dem autoscaling-min-processing-units- oder autoscaling-max-processing-units-Flags, da mit --processing-units legt eine bestimmte Anzahl von Verarbeitungseinheiten fest, als ein Skalierungsbereich.
  • Die Flags für Knoten und Verarbeitungseinheiten können nicht kombiniert werden. Für Sie können --autoscaling-max-nodes beispielsweise nicht mit autoscaling-min-processing-units.

Einstellungen optimieren

Behalten Sie Ihre Rechenkapazität im Blick und passen Sie Ihre Einstellungen an, wenn insbesondere nach der ersten Aktivierung des verwalteten Autoscalings. Wir empfehlen, auf der Seite Systemstatistiken im Google Cloud Console

Zugriffssteuerung

Um das verwaltete Autoscaling zu konfigurieren, müssen Sie ein Hauptkonto mit einer Rolle mit Berechtigungen erstellen und aktualisieren für die Instanz, die Sie konfigurieren.

Monitoring

Spanner bietet verschiedene Messwerte, und das verwaltete Autoscaling funktioniert, da es hoch- und herunterskaliert, Arbeitslastanforderungen. Anhand der Messwerte können Sie auch feststellen, sind optimal, um die Arbeitslast- und Kostenanforderungen Ihres Unternehmens zu erfüllen. Beispiel: Wenn Sie feststellen, dass die Knotenanzahl für eine Instanz häufig nahe an der maximalen Anzahl Knotenanzahl erhöhen, können Sie das Maximum erhöhen. Weitere Informationen über Monitoring Ihrer Spanner-Ressourcen finden Sie unter Instanzen mit Cloud Monitoring überwachen

Die folgenden Messwerte sind in Grafiken in den Systemstatistiken in der Google Cloud Console. Sie können diese Messwerte auch mit Cloud Monitoring:

  • spanner.googleapis.com/instance/autoscaling/min_node_count
  • spanner.googleapis.com/instance/autoscaling/max_node_count
  • spanner.googleapis.com/instance/autoscaling/min_processing_units
  • spanner.googleapis.com/instance/autoscaling/max_processing_units
  • spanner.googleapis.com/instance/autoscaling/high_priority_cpu_target_utilization
  • spanner.googleapis.com/instance/autoscaling/storage_target_utilization

Logging

Spanner erstellt jedes Mal ein Audit-Log für Systemereignisse, wenn ein Instanz.

Die Systemereignisprotokolle des verwalteten Autoscalings finden Sie in der In der Google Cloud Console auf der Seite Systemstatistiken.

Sie können Logs auch mit dem Log-Explorer ansehen:

  1. Öffnen Sie in der Google Cloud Console den Log-Explorer:

    Zu „Log-Explorer“

  2. Wählen Sie das entsprechende Google Cloud-Projekt aus.

  3. Geben Sie im Feld Query Folgendes ein:

     protoPayload.methodName="AutoscaleInstance"
    

    Mit der folgenden Abfrage können Sie die Logs weiter filtern:

    resource.type="spanner_instance"
    resource.labels.instance_id=INSTANCE_ID
    resource.labels.project_id=PROJECT_ID
    logName="projects/span-cloud-testing/logs/cloudaudit.googleapis.com%2Fsystem_event"
    protoPayload.methodName="AutoscaleInstance"
  4. Klicken Sie auf Abfrage ausführen.

Im Bereich Abfrageergebnisse werden die Logs der letzten Stunde angezeigt.

Weitere Informationen zum Anzeigen von Logs finden Sie unter Cloud Logging. Sie können logbasierte Benachrichtigungen einrichten. auf der Seite Log-Explorer in Google Cloud oder mithilfe der Methode Cloud Monitoring API

Nächste Schritte