Nesta página, descrevemos como resolver problemas de componentes do Spanner para encontrar as origem da latência. Para saber mais sobre possíveis pontos de latência em um solicitação do Spanner, consulte Pontos de latência em uma solicitação do Spanner.
No aplicativo cliente que afeta seu serviço, confirme se há um de aumento na latência de ida e volta do cliente. Verifique as seguintes dimensões nas métricas do lado do cliente.
- Nome do aplicativo cliente
- A localidade do cliente (por exemplo, zonas de VM do Compute Engine) e o host (que são os nomes de VM)
- Método da API Spanner
- Status da API Spanner
Agrupe por essas dimensões para saber se o problema está limitado a um cliente, status ou método específico. Para cargas de trabalho birregionais ou multirregionais, verifique se o problema está limitado a um cliente ou região do Spanner específico.
Verifique a integridade do aplicativo cliente, especialmente a infraestrutura de computação no lado do cliente (por exemplo, utilização de VM, CPU ou memória, conexões, descritores de arquivo etc.).
Verifique a latência nos componentes do Spanner:
a. Confira a latência de ida e volta do cliente com o OpenTelemetry ou com o OpenCensus.
b. Verifique a latência do Google Front End (GFE) com o OpenTelemetry ou com o OpenCensus.
c. Verificar a latência de solicitação da API Spanner com o OpenTelemetry ou com o OpenCensus.
Se você tiver uma alta latência de ida e volta do cliente, mas uma baixa latência do GFE e uma baixa latência de solicitação da API Spanner, o código do aplicativo poderá ter um problema. Também pode indicar um problema de rede entre o cliente e o GFE regional. Se o aplicativo tiver um problema de desempenho que cause lentidão em alguns caminhos do código, o tempo de retorno do cliente para cada solicitação de API poderá aumentar. Também pode haver um problema no sistema de computação infraestrutura que não foi detectada na etapa anterior.
Verifique as seguintes dimensões para as métricas do Spanner:
- Nome do banco de dados do Spanner
- Método da API Spanner
- Status da API Spanner
Agrupe por essas dimensões para saber se o problema está limitado a um banco de dados, status ou método específico. Para cargas de trabalho birregionais ou multirregionais, verifique se o problema está limitado a uma região específica.
Se você tiver uma alta latência do GFE, mas uma baixa solicitação da API Spanner latência, pode ter uma das seguintes causas:
Acessar um banco de dados de outra região. Essa ação pode resultar em um GFE alto e baixa latência de solicitações da API Spanner. Por exemplo: tráfego de um cliente na região
us-east1
que tem uma instância na A regiãous-central1
pode ter uma latência alta do GFE, mas uma Latência de solicitação da API Spanner.Há um problema na camada GFE. Verifique o Painel de status do Google Cloud. para saber se há algum problema de rede em andamento na sua região. Se não houver nenhum problema, abra um caso de suporte e inclua essas informações para que os engenheiros de suporte possam ajudar na solução de problemas do GFE.
Verifique o uso da CPU da instância. Se a utilização da CPU da instância estiver acima do nível recomendado, precisa adicionar mais nós manualmente ou configurar o escalonamento automático. Para mais informações, consulte Visão geral do escalonamento automático.
Observe e resolva possíveis pontos de acesso ou padrões de acesso desequilibrados usando o Key Visualizer e tente reverter as mudanças no código do aplicativo que estão fortemente relacionadas ao período do problema.
Verifique se há alterações no padrão de tráfego.
Marque Insights de consulta e Insights de transações para se há gargalos no desempenho de consultas ou transações.
Use os procedimentos em Consultas ativas mais antigas para conferir consultas de despesas que possam causar um gargalo de desempenho e cancele as consultas conforme necessário.
Use os procedimentos nas seções de solução de problemas nos seguintes tópicos para resolver o problema usando a introspecção do Spanner ferramentas:
A seguir
- Agora que você identificou o componente que contém a latência, conheça o problema usando o OpenCensus. Para mais informações, consulte Analisar a latência em um componente do Spanner com o OpenTelemetry ou com o OpenCensus.
- Saiba como usar métricas para diagnosticar a latência.
- Saiba como resolver erros de limite de tempo excedido do Spanner.