Latenzquellen ermitteln

Auf dieser Seite wird beschrieben, wie Sie Fehler bei Spanner-Komponenten beheben, um die Ursache der Latenz zu finden. Weitere Informationen zu möglichen Latenzpunkten in einer Spanner-Anfrage finden Sie unter Latenzpunkte in einer Spanner-Anfrage.

  1. Prüfen Sie in Ihrer Clientanwendung, die sich auf Ihren Dienst auswirkt, ob die Latenz durch die Client-Umlauflatenz erhöht wird. Prüfen Sie die folgenden Dimensionen aus Ihren clientseitigen Messwerten.

    • Name der Clientanwendung
    • Client-Standort (z. B. Compute Engine-VM-Zonen) und Host (d. h. VM-Namen)
    • Spanner API-Methode
    • Spanner API-Status

    Gruppieren Sie nach diesen Dimensionen, um festzustellen, ob das Problem auf einen bestimmten Client, Status oder eine bestimmte Methode beschränkt ist. Prüfen Sie bei dualen oder multiregionalen Arbeitslasten, ob sich das Problem auf einen bestimmten Client oder eine bestimmte Spanner-Region beschränkt.

  2. Prüfen Sie den Zustand Ihrer Clientanwendung, insbesondere die Computing-Infrastruktur auf der Clientseite (z. B. VM-, CPU- oder Speicherauslastung, Verbindungen und Dateideskriptoren).

  3. Latenz in Spanner-Komponenten prüfen:

    a. Prüfen Sie die Client-Relaislatenz mit OpenTelemetry oder mit OpenCensus.

    b. Prüfen Sie die Latenz des Google-Front-Ends (GFE) mit OpenTelemetry oder mit OpenCensus.

    c. Prüfen Sie die Latenz von Spanner API-Anfragen mit OpenTelemetry oder mit OpenCensus.

    Wenn die Client-Umlauflatenz hoch, die GFE-Latenz jedoch niedrig und die Latenz der Spanner API-Anfrage niedrig ist, liegt möglicherweise ein Problem mit dem Anwendungscode vor. Es kann auch auf ein Netzwerkproblem zwischen dem Client und dem regionalen GFE hinweisen. Wenn Ihre Anwendung ein Leistungsproblem hat, das dazu führt, dass einige Codepfade langsam sind, kann sich die Client-Umlauflatenz für jede API-Anfrage erhöhen. Möglicherweise liegt auch ein Problem in der Client-Computing-Infrastruktur vor, das im vorherigen Schritt nicht erkannt wurde.

  4. Prüfen Sie die folgenden Dimensionen auf Spanner-Messwerte:

    • Name der Spanner-Datenbank
    • Spanner API-Methode
    • Spanner API-Status

    Gruppieren Sie nach diesen Dimensionen, um festzustellen, ob sich das Problem auf eine bestimmte Datenbank, einen bestimmten Status oder eine bestimmte Methode beschränkt. Prüfen Sie bei dual- oder multiregionalen Arbeitslasten, ob sich das Problem auf eine bestimmte Region beschränkt.

    Wenn die GFE-Latenz hoch, die Latenz der Spanner API-Anfrage aber niedrig ist, kann das eine der folgenden Ursachen haben:

    • Zugriff auf eine Datenbank aus einer anderen Region Diese Aktion kann zu einer hohen GFE-Latenz und einer niedrigen Latenz der Spanner API-Anfrage führen. Beispielsweise hat der Traffic von einem Client in der Region us-east1, der eine Instanz in der Region us-central1 hat, möglicherweise eine hohe GFE-Latenz, aber eine niedrigere Spanner API-Anfragelatenz.

    • Es gibt ein Problem in der GFE-Ebene. Prüfen Sie im Google Cloud -Status-Dashboard, ob in Ihrer Region laufende Netzwerkprobleme auftreten. Wenn keine Probleme auftreten, öffnen Sie eine Supportanfrage und geben Sie diese Informationen an, damit Supporttechniker bei der Fehlerbehebung beim Google Front End helfen können.

  5. Prüfen Sie die CPU-Auslastung der Instanz. Wenn die CPU-Auslastung der Instanz über dem empfohlenen Wert liegt, sollten Sie manuell weitere Knoten hinzufügen oder das Autoscaling einrichten. Weitere Informationen finden Sie unter Autoscaling.

  6. Beobachten und beheben Sie mithilfe des Key Visualizers potenzielle Hotspots oder ungleichmäßige Zugriffsmuster und versuchen Sie, alle Änderungen am Anwendungscode rückgängig zu machen, die in engem Zusammenhang mit dem Zeitraum des Problems stehen.

  7. Prüfen Sie, ob sich die Zugriffsmuster geändert haben.

  8. Prüfen Sie unter Statistiken zu Abfragen und Statistiken zu Transaktionen, ob es Engpässe bei der Abfrage- oder Transaktionsleistung gibt.

  9. Verwenden Sie die Verfahren unter Älteste aktive Abfragen, um alle Ausgabenabfragen zu sehen, die zu einem Leistungsengpass führen könnten, und brechen Sie die Abfragen bei Bedarf ab.

  10. Verwenden Sie die Verfahren in den Abschnitten zur Fehlerbehebung in den folgenden Themen, um das Problem mithilfe von Spanner-Inspektionstools weiter zu beheben:

Nächste Schritte