Betriebsrichtlinien für SQL Server-Instanzen

Die SLA-Vereinbarung für Cloud SQL schließt Ausfälle aus, die durch Faktoren außerhalb der Kontrolle von Google verursacht wurden. Auf dieser Seite wird beschrieben, welche nutzerseitig gesteuerten Konfigurationen zu Ausfällen einer Cloud SQL-Instanz führen können.

Einführung

Cloud SQL wurde so eingerichtet, dass Sie die größtmögliche Kontrolle über die Konfiguration Ihrer Instanz erhalten. Dies umfasst einige Konfigurationen, die das Risiko von Instanzausfällen in Abhängigkeit von der Last und anderen Konfigurationsparametern erhöhen. Wenn Ihre Instanz ausfällt und Cloud SQL feststellt, dass die auf dieser Seite beschriebenen Betriebsbeschränkungen nicht eingehalten wurden, wird die Ausfallzeit nicht durch das Cloud SQL SLA abgedeckt (bzw. nicht darauf angerechnet).

Sie erhalten hier eine Übersicht über die Betriebsbeschränkungen, damit Sie wissen, bei welchen Konfigurationen diese Risiken auftreten, wie Sie ein versehentliches Wechseln zu einer dieser Konfigurationen vermeiden können und wie Sie die Risiken mindern können, wenn die Konfiguration für Ihr Geschäftsumfeld erforderlich ist.

Ausgeschlossene Konfigurationen

Die ausgeschlossenen Konfigurationen fallen in die folgenden Kategorien:

  • Allgemeine Konfigurationsanforderungen
  • Datenbank-Flag-Werte
  • Ressourcenlimits

Allgemeine Konfigurationsanforderungen

Das SLA deckt nur Cloud SQL-Instanzen ab, die für eine hohe Verfügbarkeit mit mindestens einer dedizierten CPU konfiguriert sind. Instanzen mit gemeinsam genutztem Kern und Instanzen mit einer einzelnen Zone sind vom SLA nicht abgedeckt.

Wenn die Instanz so konfiguriert und verwendet wird, dass die Arbeitslast die Instanz überlastet, gilt das SLA nicht. Hier einige Beispiele:

  • Eine Kombination aus work_mem, spezifischen Arbeitslastabfragen und der Anzahl paralleler aktiver Verbindungen führt dazu, dass das System nicht mehr über genügend Arbeitsspeicher verfügt. Dies führt dazu, dass PostgreSQL-Worker-Back-Ends mit resultierenden Wiederherstellungsvorgängen abstürzen, die von postgreSQL ausgeführt werden.
  • Eine Kombination aus checkpoint_timeout, max_wal_size und einer hohen Arbeitslast, möglicherweise zusammen mit einer leistungsschwachen VM-Größe, kann dazu führen, dass die Wiederherstellung (WA-Wiedergabe) lange dauert.
  • Sehr lange Transaktionen zusammen mit Arbeitslasten, die eine große Anzahl von temporären Dateien erstellen, machen es autovacuum schwer mitzuhalten. Dies kann zu aufgeblähten Tabellen und Leistungseinbußen führen.

Diese Beispiele sind keine vollständige Liste, da es viele Möglichkeiten zur Überlastung der PostgreSQL-Datenbank gibt. Wir empfehlen Ihnen dringend, Benachrichtigungen und Monitoring in Cloud Monitoring einzurichten.

Datenbank-Flag-Werte

Mit Cloud SQL können Sie Ihre Instanz mit Datenbank-Flags konfigurieren. Einige dieser Flags können so eingestellt werden, dass die Stabilität der Instanz oder Langlebigkeit ihrer Daten beeinträchtigt wird.

Ressourcenlimits

Die folgenden Ressourcenlimits müssen vermieden werden, um die Abdeckung durch das SLA sicherzustellen:

Einschränkung Beschreibung Erkennung Lösung Prävention
Speicher voll Wenn Ihre Instanz keinen ausreichenden Speicherplatz mehr hat und die automatische Speichererweiterung nicht aktiviert ist, wird die Instanz offline geschaltet. Dieser Ausfall ist nicht durch das SLA abgedeckt. Sie können sich den von Ihrer Instanz belegten Speicherplatz in der Google Cloud Console auf der Seite "Instanzdetails" ansehen. Weitere Informationen

Richten Sie eine Stackdriver-Warnung ein, um die Speicherbelegung zu überwachen und Warnungen bei Erreichen eines bestimmten Schwellenwerts zu erhalten. Weitere Informationen

Erhöhen Sie die Speichergröße für die Instanz. Die Speichergröße kann zwar erhöht, aber nicht verringert werden. Aktivieren Sie die automatische Speichererweiterung für die Instanz. Weitere Informationen
CPU überlastet Wenn die CPU-Auslastung sechs Stunden lang bei über 98 % liegt, ist Ihre Instanz nicht richtig für Ihre Arbeitslast dimensioniert. In diesem Fall ist keine SLA-Abdeckung gegeben. Sie können sich den Prozentsatz der verfügbaren CPU, der von Ihrer Instanz verwendet wird, in der Google Cloud Console auf der Seite "Instanzdetails" ansehen. Weitere Informationen

Richten Sie eine Stackdriver-Warnung ein, um die CPU-Auslastung zu überwachen und Warnungen bei Erreichen eines bestimmten Schwellenwerts zu erhalten. Weitere Informationen

Erhöhen Sie die CPU-Anzahl für Ihre Instanz. Beachten Sie, dass bei einer Änderung der CPUs ein Neustart erforderlich ist.

Wenn Ihre Instanz bereits die maximale CPU-Anzahl erreicht hat, teilen Sie Ihre Datenbank auf mehrere Instanzen auf.

Überwachen Sie die CPU-Auslastung und erhöhen Sie bei Bedarf die CPU-Anzahl. Beachten Sie, dass bei einer Änderung der Instanzstufe ein Neustart erforderlich ist.