Hohe Datenbankauslastung mit KI beheben

In diesem Dokument wird beschrieben, wie Sie die KI-Unterstützung in Cloud SQL verwenden können, um eine hohe Datenbanklast in Cloud SQL zu beheben. Sie können die KI-Unterstützungsfunktionen von Cloud SQL und Gemini Cloud Assist verwenden, um Ihre Abfragen in Cloud SQL zu untersuchen, zu analysieren, Empfehlungen zu erhalten und diese schließlich zu implementieren, um Ihre Abfragen zu optimieren.

Über das Dashboard Query Insights in der Google Cloud Console können Sie Ihre Datenbank analysieren und Probleme mit Ereignissen beheben, wenn die Datenbanklast in Ihrem System höher als gewöhnlich ist. Cloud SQL verwendet die Daten der 24 Stunden vor dem ausgewählten Zeitraum, um die erwartete Last Ihrer Datenbank zu berechnen. Sie können die Gründe für die Ereignisse mit höherer Last untersuchen und die Beweise für die verringerte Leistung analysieren. Schließlich bietet Cloud SQL Empfehlungen zur Optimierung Ihrer Datenbank, um die Leistung zu verbessern.

Hinweise

So beheben Sie Probleme mit hoher Datenbanklast mithilfe von KI:

  1. Einschränkungen bei der KI-gestützten Fehlerbehebung
  2. KI‑gestützte Fehlerbehebung aktivieren

Erforderliche Rollen und Berechtigungen

Informationen zu den Rollen und Berechtigungen, die für die Fehlerbehebung bei hoher Datenbanklast mit KI-Unterstützung erforderlich sind, finden Sie unter Mit KI beobachten und Fehler beheben.

KI‑Unterstützung nutzen

Wenn Sie KI-Unterstützung bei der Fehlerbehebung bei hoher Datenbanklast verwenden möchten, rufen Sie in der Google Cloud Console die Seite Instanzübersicht oder das Dashboard Query Insights auf.

Seite „Instanzübersicht“

So beheben Sie eine hohe Datenbanklast mit KI-Unterstützung auf der Seite Instanzübersicht:

  1. Wechseln Sie in der Google Cloud Console zur Seite Cloud SQL-Instanzen.

    Cloud SQL-Instanzen aufrufen

  2. Klicken Sie auf den Instanznamen, um die Übersichtsseite einer Instanz zu öffnen.
  3. Wählen Sie auf der Seite Übersicht im Menü Diagramm einen Messwert für die Datenbank aus. Sie können einen beliebigen Messwert auswählen.
  4. Optional: Wenn Sie einen bestimmten Analysezeitraum auswählen möchten, verwenden Sie den Filter Zeitraum. Sie können entweder 1 Stunde, 6 Stunden, 1 Tag, 7 Tage, 30 Tage oder einen benutzerdefinierten Zeitraum auswählen.
  5. Diagramm zur Datenbankleistung auf der Übersichtsseite, das die CPU-Auslastung über einen Zeitraum von 24 Stunden zeigt. Außerdem gibt es eine Option zum Analysieren der Instanzleistung.

    Sie können in bestimmte Abschnitte des Diagramms zoomen, in denen Sie Bereiche mit hoher Last sehen, die Sie analysieren möchten. In einem Bereich mit hoher Last kann beispielsweise die CPU-Auslastung nahe 100 % liegen. Wenn Sie heranzoomen möchten, klicken Sie auf einen Teil des Diagramms und wählen Sie ihn aus.

    Zoomen Sie das Diagramm zur Datenbankleistung heran.
  6. Klicken Sie auf Instanzleistung analysieren, um mit KI-Unterstützung Probleme mit hoher Datenbanklast zu beheben. Dadurch wird die Seite Datenbanklast analysieren generiert.

Query Insights-Dashboard

So beheben Sie eine hohe Datenbanklast mit KI-Unterstützung im Dashboard Query Insights:

  1. Wechseln Sie in der Google Cloud Console zur Seite Cloud SQL-Instanzen.

    Cloud SQL-Instanzen aufrufen

  2. Klicken Sie auf den Instanznamen, um die Übersichtsseite einer Instanz zu öffnen.
  3. Klicken Sie auf Query Insights, um das Dashboard Query Insights zu öffnen.
  4. Optional: Mit dem Filter Zeitraum können Sie einen Zeitraum von 1 Stunde, 6 Stunden, 1 Tag, 7 Tagen, 30 Tagen oder einen benutzerdefinierten Zeitraum auswählen.
  5. Diagramm zur Datenbanklast im Query Insights-Diagramm, das die Abfragelatenz über einen Zeitraum von 24 Stunden zeigt. Außerdem gibt es eine Option zum Analysieren der Instanzleistung.

    Sie können in bestimmte Abschnitte des Diagramms zoomen, in denen Sie Bereiche mit höherer Datenbanklast nach Abfrageausführungszeit sehen. Wenn Sie heranzoomen möchten, klicken Sie auf einen Teil des Diagramms und wählen Sie ihn aus.

  6. Klicken Sie im Diagramm zur Datenbanklast auf Instanzleistung analysieren, um mit KI-Unterstützung mit der Fehlerbehebung bei hoher Datenbanklast zu beginnen. Dadurch wird die Seite Datenbanklast analysieren generiert.

Hohe Datenbanklast analysieren

Mit KI-Unterstützung können Sie die Details Ihrer Datenbanklast analysieren und Fehler beheben.

Auf der Seite Datenbanklast analysieren können Sie die folgenden Details für Ihre Cloud SQL-Instanz aufrufen:

  • Analysezeitraum
  • CPU-Auslastung (P99)
  • Arbeitsspeicherauslastung (P99)

In Cloud SQL wird ein Diagramm für Transaktionen/Sekunde angezeigt, in dem Sie die Transaktionsaktivität im ausgewählten Zeitraum sehen können. Sie können nach plötzlichen Aktivitätsspitzen in einem bestimmten Zeitraum suchen.

Seite „Datenbankleistung analysieren“ für Cloud SQL for PostgreSQL

Analysezeitraum

Cloud SQL analysiert Ihre Datenbank für den Zeitraum, den Sie im Diagramm zur Datenbanklast im Dashboard Query Insights oder auf der Seite Instanzübersicht auswählen. Wenn Sie einen Zeitraum von weniger als 24 Stunden auswählen, wird der gesamte Zeitraum von Cloud SQL analysiert. Wenn Sie einen Zeitraum von mehr als 24 Stunden auswählen, werden in Cloud SQL nur die letzten 24 Stunden des Zeitraums für die Analyse ausgewählt.

Um die Baseline-Leistungsanalyse Ihrer Datenbank zu berechnen, umfasst der Analysezeitraum von Cloud SQL 24 Stunden eines Baseline-Zeitraums. Wenn der ausgewählte Zeitraum auf einen anderen Tag als Montag fällt, verwendet Cloud SQL einen Baseline-Zeitraum von 24 Stunden vor dem ausgewählten Zeitraum. Wenn der ausgewählte Zeitraum an einem Montag beginnt, verwendet Cloud SQL einen Baseline-Zeitraum, der 7 Tage vor dem ausgewählten Zeitraum beginnt.

Situation

Wenn Cloud SQL die Analyse startet, prüft Cloud SQL auf signifikante Änderungen bei den folgenden wichtigen Messwerten:

  • Abfragen pro Sekunde (Queries per second, QPS)
  • CPU
  • Arbeitsspeicher
  • Laufwerk-E/A

Cloud SQL vergleicht die aggregierten Baseline-Daten für Ihre Datenbank mit den Leistungsdaten Ihres Analysezeitraums. Wenn Cloud SQL eine erhebliche Änderung des Schwellenwerts für eine wichtige Messgröße erkennt, wird eine mögliche Situation mit Ihrer Datenbank angezeigt. Die ermittelte Situation kann eine mögliche Ursache für die hohe Belastung Ihrer Datenbank im ausgewählten Zeitraum sein.

Ein Beispiel für eine Situation, in der Ihre Datenbank eine hohe Last aufweist, ist Lock contention (Konflikt um Sperren).

Bei der Analyse kann Cloud SQL feststellen, dass die Wartezeit bei Sperren deutlich gestiegen ist. In Cloud SQL werden möglicherweise weitere Situationen aufgeführt, in denen wichtige Messwerte einen deutlichen Anstieg aufweisen. Beispielsweise können auch die folgenden Situationen aufgeführt sein:

  • Konflikt bei Systemressourcen
  • Unzureichender Zwischenspeicher
  • Übermäßiges Logging

Situation und Nachweis für Cloud SQL for PostgreSQL

Belege

Für jede Situation stellt Cloud SQL eine Liste von Beweisen zur Verfügung, die den Befund untermauern. Cloud SQL stützt sich auf Messwerte, die von der Instanz erfasst werden.

Für jede Situation gibt es unterstützende Beweise, die zum Erkennen von Anomalien bei der Systemleistung verwendet werden. Cloud SQL erkennt eine Anomalie, wenn die Systemleistung bestimmte Schwellenwerte überschreitet oder bestimmte zeitgebundene Kriterien erfüllt. Cloud SQL definiert diese Grenzwerte oder Kriterien für jede Situation.

Zur Unterstützung der Situation Lock contention (Konflikt um Sperren) können Sie die folgenden Beweise sehen:

  • Sperre-Wartezeit-Verhältnis: Eine um 40.786,04% höhere Wartezeit bei Sperren im Vergleich zum zugrunde liegenden Beobachtungszeitraum festgestellt.

Klicken Sie auf die einzelnen Situationen, um die während der Analyse abgerufenen Beweise anzusehen. Die Beweise werden im Bereich neben der entsprechenden Situation angezeigt.

Empfehlungen

Basierend auf allen analysierten Situationen erhalten Sie von Cloud SQL eine oder mehrere umsetzbare Empfehlungen, mit denen Sie die Probleme Ihrer hohen Datenbanklast beheben können. Cloud SQL präsentiert die Empfehlungen mit einer Kosten-Nutzen-Analyse, damit Sie eine fundierte Entscheidung darüber treffen können, ob Sie die Empfehlung umsetzen möchten.

In einigen Fällen gibt es aufgrund der Analyse möglicherweise keine Empfehlung.

Tabelle mit Empfehlungen

Beispiel:

  • Blockierende Abfragen identifizieren: Identifizieren Sie potenzielle blockierende Abfragen und überprüfen Sie sie auf Optimierungsmöglichkeiten.

Wenn Sie wissen möchten, wie Sie diese erste Empfehlung umsetzen können, klicken Sie auf den Link Weitere Informationen.

Wenn Sie die Fehlerbehebung fortsetzen oder weitere Unterstützung bei der Systemleistung erhalten möchten, können Sie auch Gemini Cloud Assist öffnen. Weitere Informationen finden Sie unter Mit KI beobachten und Fehler beheben.

Nächste Schritte