Esta página foi traduzida pela API Cloud Translation.

Pontos de latência em uma solicitação do Spanner

Esta página oferece uma visão geral dos componentes de alto nível envolvidos em uma solicitação do Spanner e como cada componente pode afetar a latência.

Solicitações da API Spanner

Os componentes de alto nível usados para fazer uma solicitação da API Spanner incluem:

Bibliotecas de cliente do Spanner, que fornecem uma camada de abstração sobre o gRPC e processam detalhes de comunicação do servidor, como gerenciamento de sessão, transações e novas tentativas.
O Google Front End (GFE), que é um serviço de infraestrutura comum a todos os serviços do Google Cloud , incluindo o Spanner. O GFE verifica se todas as conexões Transport Layer Security (TLS) foram interrompidas e aplica proteções contra ataques de negação de serviço. Para saber mais sobre o GFE, consulte Google Front End Service.
O front-end da API Spanner (AFE), que realiza várias verificações na solicitação da API, incluindo autenticação, autorização e verificações de cota, e mantém sessões e estados de transação.
O banco de dados do Spanner, que executa leituras e gravações no banco de dados.

Quando você faz uma chamada de procedimento remoto para o Spanner, as bibliotecas de cliente do Spanner preparam a solicitação da API. Em seguida, a solicitação da API passa pelo GFE e pelo AFE do Spanner antes de chegar ao banco de dados do Spanner.

Ao medir e comparar as latências de solicitação entre diferentes componentes e o banco de dados, você pode determinar qual componente está causando o problema. Essas latências incluem ida e volta do cliente, GFE, solicitação da API Spanner e latências de consulta.

Diagrama da arquitetura do Spanner.

As seções a seguir explicam cada tipo de latência que aparece no diagrama anterior.

Latência de ida e volta do cliente

A latência de ida e volta do cliente é o período (em milissegundos) entre o primeiro byte da solicitação da API Spanner que o cliente envia ao banco de dados (pelo GFE e pelo front-end da API Spanner) e o último byte da resposta que o cliente recebe do banco de dados.

Diagrama da arquitetura do Spanner para latência de ida e volta do cliente.

A métrica grpc.io/client/roundtrip_latency fornece o tempo entre o primeiro byte da solicitação de API enviada e o último byte da resposta recebida.

Para capturar e visualizar a latência desse componente, consulte Capturar latência de ida e volta do cliente com o OpenTelemetry ou com o OpenCensus.

Latência do GFE

A latência do Google Front End (GFE) é o período (em milissegundos) entre o momento em que a rede do Google recebe uma chamada de procedimento remoto do cliente e o momento em que o GFE recebe o primeiro byte da resposta. Essa latência não inclui handshakes de TCP/SSL.

Diagrama da arquitetura do Spanner para latência do GFE.

Cada resposta do Spanner, seja REST ou gRPC, inclui um cabeçalho que contém o tempo total entre o GFE e o back-end (o serviço do Spanner) para a solicitação e a resposta. Isso ajuda a diferenciar melhor a origem da latência entre o cliente e a rede do Google.

A métrica spanner/gfe_latency captura e expõe a latência do GFE para solicitações do Spanner.

Para capturar e visualizar a latência desse componente, consulte Capturar a latência do GFE com o OpenTelemetry ou com o OpenCensus.

Latência de solicitação da API Spanner

A latência da solicitação da API Spanner é o período (em segundos) entre o primeiro byte da solicitação que o AFE do Spanner recebe e o último byte da resposta que o front-end da API Spanner envia. A latência inclui o tempo necessário para o processamento das solicitações de API no back-end do Spanner e na camada de API. No entanto, essa latência não inclui sobrecarga de rede ou proxy reverso entre clientes e servidores do Spanner.

Diagrama da arquitetura do Spanner para latência de solicitação da API Spanner.

A métrica spanner.googleapis.com/api/request_latencies captura e expõe a latência do AFE do Spanner para solicitações do Spanner.

Para capturar e visualizar a latência desse componente, consulte Capturar a latência de solicitação da API Spanner com o OpenTelemetry ou com o OpenCensus.

Latência da consulta

A latência de consulta é o tempo (em milissegundos) necessário para executar consultas SQL no banco de dados do Spanner.

Diagrama da arquitetura do Spanner para latência de consulta.

A latência da consulta está disponível para a API executeSql.

Se o parâmetro QueryMode estiver definido como WITH_STATS ou WITH_PLAN_AND_STATS, o ResultSetStats do Spanner estará disponível nas respostas. ResultSetStats inclui o tempo decorrido para executar consultas no banco de dados do Spanner.

Para capturar e visualizar a latência desse componente, consulte Capturar latência de consulta com o OpenTelemetry ou com o OpenCensus.

A seguir

Saiba como identificar pontos de latência nos componentes do Spanner.