Identificar onde ocorre a latência

Neste tópico, descrevemos como solucionar problemas de componentes do Spanner para encontrar a origem da latência. Para saber mais sobre possíveis pontos de latência em uma solicitação do Spanner, consulte Pontos de latência em uma solicitação do Spanner.

  1. No aplicativo cliente que afeta seu serviço, confirme se há um aumento na latência de ida e volta do cliente. Verifique as seguintes dimensões nas métricas do lado do cliente.

    • Nome do aplicativo cliente
    • Localidade do cliente (por exemplo, zonas de VM do Compute Engine) e host (ou seja, nomes de VM)
    • Método da API Spanner
    • Status da API Spanner

    Agrupe por essas dimensões para ver se o problema está limitado a um cliente, status ou método específico. Para cargas de trabalho multirregionais, veja se o problema está limitado a um cliente específico ou uma região do Spanner.

  2. Verifique a integridade do aplicativo cliente, especialmente a infraestrutura de computação no lado do cliente (por exemplo, utilização de VM, CPU ou memória, conexões, descritores de arquivos etc.).

  3. Verifique a latência nos componentes do Spanner:

    a. Verifique a latência de ida e volta do cliente com o OpenTelemetry ou com o OpenCensus.

    b. Verifique a latência do Google Front End (GFE) com o OpenTelemetry ou com o OpenCensus.

    c. Verifique a latência da solicitação da API Spanner com o OpenTelemetry ou com o OpenCensus.

    Se você tiver alta latência de ida e volta do cliente, mas baixa latência do GFE e baixa latência de solicitação da API Spanner, o código do aplicativo poderá ter um problema. Também pode indicar um problema de rede entre o cliente e o GFE regional. Se o aplicativo tiver um problema de desempenho que cause lentidão em alguns caminhos de código, a latência de ida e volta do cliente para cada solicitação de API poderá aumentar. Também pode haver um problema na infraestrutura de computação do cliente que não tenha sido detectado na etapa anterior.

  4. Verifique as seguintes dimensões para as métricas do Spanner:

    • Nome do banco de dados do Spanner
    • Método da API Spanner
    • Status da API Spanner

    Agrupe por essas dimensões para ver se o problema está limitado a um banco de dados, status ou método específico. Para cargas de trabalho multirregionais, verifique se o problema está limitado a uma região específica.

    Se você tem uma alta latência do GFE, mas uma baixa latência de solicitações da API Spanner, isso pode ter uma das seguintes causas:

    • Acessar um banco de dados de outra região. Essa ação pode levar a uma alta latência de GFE e baixa latência de solicitação da API Spanner. Por exemplo, o tráfego de um cliente na região us-east1 que tem uma instância em us-central1 pode ter uma alta latência do GFE, mas uma latência de solicitação da API Spanner menor.

    • Há um problema na camada do GFE. Verifique o Painel de status do Google Cloud para ver se há algum problema de rede contínuo na sua região. Se não houver problemas, abra um caso de suporte e inclua essas informações para que os engenheiros de suporte possam ajudar a resolver o problema do GFE.

  5. Verifique a utilização da CPU da instância. Se a utilização da CPU da instância estiver acima do nível recomendado, adicione manualmente mais nós ou configure o escalonamento automático. Para mais informações, consulte Visão geral do escalonamento automático.

  6. Observe e solucione possíveis pontos de acesso ou padrões de acesso desequilibrados usando o Key Visualizer e tente reverter todas as alterações no código do aplicativo que estejam fortemente relacionadas ao período do problema.

  7. Verifique se há mudanças no padrão de tráfego.

  8. Verifique os Insights de consulta e os Insights de transação para ver se há gargalos de desempenho das consultas ou transações. Na maioria dos casos, você precisa seguir as práticas recomendadas do Spanner para otimizar suas consultas ou transações.

  9. Use os procedimentos em Consultas ativas mais antigas para consultar todas as consultas de despesa que possam causar um gargalo de desempenho e cancele-as conforme necessário.

  10. Use os procedimentos nas seções de solução de problemas nos tópicos a seguir para solucionar o problema usando as ferramentas de introspecção do Spanner:

A seguir