Esta página descreve como resolver problemas dos componentes do Spanner para encontrar a origem da latência. Para saber mais sobre possíveis pontos de latência em uma solicitação do Spanner, consulte Pontos de latência em uma solicitação do Spanner.
No aplicativo cliente que afeta seu serviço, confirme se há um aumento de latência do tempo de ida e volta do cliente. Verifique as seguintes dimensões nas métricas do lado do cliente.
- Nome do aplicativo cliente
- Localidade do cliente (por exemplo, zonas de VM do Compute Engine) e host (ou seja, nomes de VM)
- Método da API Spanner
- Status da API Spanner
Agrupe por essas dimensões para saber se o problema está limitado a um cliente, status ou método específico. Para cargas de trabalho birregionais ou multirregionais, verifique se o problema está limitado a um cliente ou região do Spanner específico.
Verifique a integridade do aplicativo cliente, especialmente a infraestrutura de computação no lado do cliente (por exemplo, utilização de VM, CPU ou memória, conexões, descritores de arquivo etc.).
Verifique a latência nos componentes do Spanner:
a. Confira a latência de ida e volta do cliente com o OpenTelemetry ou com o OpenCensus.
b. Verifique a latência do Google Front End (GFE) com o OpenTelemetry ou com o OpenCensus.
c. Verifique a latência da solicitação da API Spanner com o OpenTelemetry ou com o OpenCensus.
Se você tiver uma alta latência de ida e volta do cliente, mas uma baixa latência do GFE e uma baixa latência de solicitação da API Spanner, o código do aplicativo poderá ter um problema. Também pode indicar um problema de rede entre o cliente e o GFE regional. Se o aplicativo tiver um problema de desempenho que cause lentidão em alguns caminhos do código, o tempo de retorno do cliente para cada solicitação de API poderá aumentar. Também pode haver um problema na infraestrutura de computação do cliente que não foi detectado na etapa anterior.
Verifique as seguintes dimensões para as métricas do Spanner:
- Nome do banco de dados do Spanner
- Método da API Spanner
- Status da API Spanner
Agrupe por essas dimensões para saber se o problema está limitado a um banco de dados, status ou método específico. Para cargas de trabalho birregionais ou multirregionais, verifique se o problema está limitado a uma região específica.
Se você tiver uma alta latência do GFE, mas uma baixa latência de solicitação da API Spanner, uma das seguintes causas pode ser a causa:
Acessar um banco de dados de outra região. Essa ação pode aumentar a latência do GFE e diminuir a latência da solicitação da API Spanner. Por exemplo, o tráfego de um cliente na região
us-east1
que tem uma instância na regiãous-central1
pode ter uma latência alta do GFE, mas uma latência de solicitação da API Spanner menor.Há um problema na camada GFE. Verifique no Painel de status do Google Cloud se há algum problema de rede na sua região. Se não houver nenhum problema, abra um caso de suporte e inclua essas informações para que os engenheiros de suporte possam ajudar na solução de problemas do GFE.
Confira a utilização da CPU da instância. Se a utilização da CPU da instância estiver acima do nível recomendado, adicione manualmente mais nós ou configure o escalonamento automático. Para mais informações, consulte Visão geral do escalonamento automático.
Observe e resolva possíveis pontos de acesso ou padrões de acesso desequilibrados usando o Key Visualizer e tente reverter as mudanças no código do aplicativo que estão fortemente relacionadas ao período do problema.
Verifique se há mudanças no padrão de tráfego.
Verifique os insights de consulta e os insights de transação para saber se há gargalos de desempenho de consulta ou transação.
Use os procedimentos em Consultas ativas mais antigas para conferir consultas de despesas que possam causar um gargalo de desempenho e cancele as consultas conforme necessário.
Use os procedimentos nas seções de solução de problemas nos seguintes tópicos para resolver o problema usando as ferramentas de introspecção do Spanner:
A seguir
- Agora que você identificou o componente que contém a latência, explore o problema usando o OpenCensus. Para mais informações, consulte Capturar métricas personalizadas do lado do cliente usando o OpenTelemetry ou com o OpenCensus.
- Saiba como usar métricas para diagnosticar a latência.
- Saiba como resolver erros de limite de tempo excedido do Spanner.