Auf dieser Seite wird beschrieben, wie Sie Probleme mit Spanner-Komponenten beheben, um die die Ursache der Latenz. Weitere Informationen zu möglichen Latenzpunkten in einer Spanner-Anfrage finden Sie unter Latenzpunkte in einer Spanner-Anfrage.
Prüfen Sie in der Clientanwendung, die sich auf Ihren Dienst auswirkt, erhöhte Latenz aufgrund der Client-Roundtrip-Latenz. Überprüfen Sie die folgenden Dimensionen aus Ihren clientseitigen Messwerten.
- Name der Clientanwendung
- Clientstandort (z. B. Compute Engine-VM-Zonen) und Host (der VM-Namen)
- Spanner API-Methode
- Spanner API-Status
Nehmen Sie eine Gruppierung nach diesen Dimensionen vor, um zu sehen, ob das Problem auf eine bestimmte Client, Status oder Methode. Informationen zu Arbeitslasten mit zwei Regionen oder multiregionalen Arbeitslasten finden Sie unter Das Problem ist auf einen bestimmten Client oder eine bestimmte Spanner-Region beschränkt.
Prüfen Sie den Zustand Ihrer Clientanwendung, insbesondere die Computing-Infrastruktur auf der Clientseite (z. B. VM-, CPU- oder Speicherauslastung, Verbindungen und Dateideskriptoren).
Prüfen Sie die Latenz in den Spanner-Komponenten:
a. Prüfen Sie die Client-Relaislatenz mit OpenTelemetry oder mit OpenCensus.
b. Prüfen Sie die Latenz des Google-Front-Ends (GFE) mit OpenTelemetry oder mit OpenCensus.
c. Latenz von Spanner API-Anfragen mit OpenTelemetry prüfen oder mit OpenCensus.
Wenn Sie eine hohe Client-Umlauflatenz, aber eine niedrige GFE-Latenz haben und eine niedrige Latenz der Spanner API-Anfrage, kann der Anwendungscode haben ein Problem. Es kann auch auf ein Netzwerkproblem zwischen dem Client und dem regionalen GFE hinweisen. Wenn bei Ihrer Anwendung ein Leistungsproblem auftritt, einige Codepfade langsam sein, dann kann die Client-Roundtrip-Latenz für jede API erhöht sich möglicherweise. Möglicherweise gibt es auch ein Problem mit dem Client-Computing. die im vorherigen Schritt nicht erkannt wurde.
Überprüfen Sie die folgenden Abmessungen für Spanner-Messwerte:
- Name der Spanner-Datenbank
- Spanner API-Methode
- Spanner API-Status
Gruppieren Sie nach diesen Dimensionen, um festzustellen, ob sich das Problem auf eine bestimmte Datenbank, einen bestimmten Status oder eine bestimmte Methode beschränkt. Prüfen Sie bei biregionalen oder multiregionalen Arbeitslasten, ob sich das Problem auf eine bestimmte Region beschränkt.
Wenn Sie eine hohe GFE-Latenz, aber eine niedrige Spanner API-Anfrage haben kann dies eine der folgenden Ursachen haben:
Zugriff auf eine Datenbank aus einer anderen Region Diese Aktion kann zu einer hohen GFE-Latenz und einer niedrigen Latenz der Spanner API-Anfrage führen. Beispielsweise hat der Traffic von einem Client in der Region
us-east1
, der eine Instanz in der Regionus-central1
hat, möglicherweise eine hohe GFE-Latenz, aber eine niedrigere Latenz für Spanner API-Anfragen.Es gibt ein Problem mit der GFE-Ebene. Prüfen Sie im Google Cloud-Status-Dashboard, ob in Ihrer Region laufende Netzwerkprobleme auftreten. Wenn keine Probleme auftreten, öffnen Sie eine Supportanfrage und geben Sie diese Informationen an, damit Supporttechniker bei der Fehlerbehebung beim Google Front End helfen können.
Prüfen Sie die CPU-Auslastung der Instanz. Wenn die CPU-Auslastung der Instanz über dem empfohlenen Wert liegt, sollten Sie manuell weitere Knoten hinzufügen oder das Autoscaling einrichten. Weitere Informationen finden Sie unter Autoscaling.
Beobachten und beheben Sie mithilfe von Key Visualizer potenzielle Hotspots oder ungleichmäßige Zugriffsmuster und versuchen Sie, alle Änderungen am Anwendungscode rückgängig zu machen, die in engem Zusammenhang mit dem Zeitraum des Problems stehen.
Prüfen Sie, ob sich die Zugriffsmuster geändert haben.
Prüfen Sie Query Insights und Transaktionsinformationen ob es Engpässe bei der Abfrage- oder Transaktionsleistung gibt.
Verwenden Sie Verfahren unter Älteste aktive Abfragen. um alle Abfragen zu sehen, die zu einem Leistungsengpass führen, brechen Sie die Abfragen nach Bedarf ab.
Verwenden Sie die Verfahren in den Abschnitten zur Fehlerbehebung in den folgenden Themen, um Problem mithilfe der Spanner-Selbstprüfung beheben Tools:
Nächste Schritte
- Nachdem Sie die Komponente mit der Latenz identifiziert haben, können Sie das Problem mit OpenCensus weiter untersuchen. Weitere Informationen finden Sie unter Latenz in einer Spanner-Komponente mit OpenTelemetry prüfen oder mit OpenCensus prüfen.
- Verwendung von Messwerten zur Diagnose der Latenz
- Weitere Informationen zur Fehlerbehebung bei überschrittener Spanner-Frist