Identifique onde ocorre a latência

Esta página descreve como resolver problemas dos componentes do Spanner para encontrar a origem da latência. Para saber mais acerca dos possíveis pontos de latência num pedido do Spanner, consulte o artigo Pontos de latência num pedido do Spanner.

  1. Na aplicação cliente que afeta o seu serviço, confirme que existe um aumento da latência de ida e volta do cliente. Verifique as seguintes dimensões nas métricas do lado do cliente.

    • Nome da aplicação cliente
    • Localidade do cliente (por exemplo, zonas de VMs do Compute Engine) e anfitrião (ou seja, nomes de VMs)
    • Método da API Spanner
    • Estado da API Spanner

    Agrupe por estas dimensões para ver se o problema está limitado a um cliente, um estado ou um método específico. Para cargas de trabalho de duas regiões ou multirregionais, verifique se o problema está limitado a um cliente ou a uma região do Spanner específicos.

  2. Verifique o estado da aplicação cliente, especialmente a infraestrutura de computação no lado do cliente (por exemplo, utilização de VM, CPU ou memória, ligações, descritores de ficheiros, etc.).

  3. Verifique a latência nos componentes do Spanner:

    a. Verifique a latência de ida e volta do cliente com o OpenTelemetry ou com o OpenCensus.

    b. Verifique a latência do front-end da Google (GFE) com o OpenTelemetry ou com o OpenCensus.

    c. Verifique a latência do pedido da API Spanner com o OpenTelemetry ou com o OpenCensus.

    Se tiver uma latência de ida e volta do cliente elevada, mas uma latência do GFE baixa e uma latência de pedido da API Spanner baixa, o código da aplicação pode ter um problema. Também pode indicar um problema de rede entre o cliente e o GFE regional. Se a sua aplicação tiver um problema de desempenho que faça com que alguns caminhos de código sejam lentos, a latência de ida e volta do cliente para cada pedido de API pode aumentar. Também pode haver um problema na infraestrutura de computação do cliente que não foi detetado no passo anterior.

  4. Verifique as seguintes dimensões para as métricas do Spanner:

    • Nome da base de dados do Spanner
    • Método da API Spanner
    • Estado da API Spanner

    Agrupe por estas dimensões para ver se o problema se limita a uma base de dados, um estado ou um método específico. Para cargas de trabalho de duas regiões ou multirregionais, verifique se o problema está limitado a uma região específica.

    Se tiver uma latência GFE elevada, mas uma latência de pedido da API Spanner baixa, pode dever-se a uma das seguintes causas:

    • Aceder a uma base de dados de outra região. Esta ação pode levar a uma latência GFE elevada e a uma latência de pedido da API Spanner baixa. Por exemplo, o tráfego de um cliente na região us-east1 que tenha uma instância na região us-central1 pode ter uma latência GFE elevada, mas uma latência de pedido da API Spanner inferior.

    • Existe um problema na camada GFE. Consulte o Google Cloud Painel de controlo de estado para verificar se existem problemas de rede em curso na sua região. Se não existirem problemas, abra um registo de apoio técnico e inclua estas informações para que os engenheiros de apoio técnico possam ajudar a resolver problemas do GFE.

  5. Verifique a utilização da CPU da instância. Se a utilização da CPU da instância estiver acima do nível recomendado, deve adicionar manualmente mais nós ou configurar o dimensionamento automático. Para mais informações, consulte o artigo Vista geral do ajuste de escala automático.

  6. Observe e resolva potenciais pontos críticos ou padrões de acesso desequilibrados usando o Key Visualizer e tente reverter quaisquer alterações ao código da aplicação que estejam fortemente correlacionadas com o período do problema.

  7. Verifique se existem alterações nos padrões de tráfego.

  8. Verifique as Estatísticas de consultas e as Estatísticas de transações para ver se pode haver gargalos de desempenho de consultas ou transações.

  9. Use os procedimentos em Consultas ativas mais antigas para ver as consultas de despesas que podem causar um gargalo de desempenho e cancelar as consultas conforme necessário.

  10. Use os procedimentos nas secções de resolução de problemas nos seguintes tópicos para resolver o problema mais detalhadamente com as ferramentas de introspeção do Spanner:

O que se segue?