Esta página foi traduzida pela API Cloud Translation.

Ler estatísticas

O Spanner fornece tabelas integradas que armazenam estatísticas sobre leituras. É possível recuperar estatísticas dessas tabelas SPANNER_SYS.READ_STATS* usando instruções SQL.

Quando usar as estatísticas de leitura

As estatísticas de leitura fornecem insights sobre como um aplicativo está usando o banco de dados e são úteis para investigar problemas de desempenho. Por exemplo, é possível verificar quais formas de leitura estão sendo executadas em um banco de dados, a frequência com que são executadas e explicar as características de desempenho dessas formas de leitura. Use as estatísticas de leitura do banco de dados para identificar formas de leitura que resultam em alto uso da CPU. Em um nível elevado, as estatísticas de leitura ajudarão você a entender o comportamento do tráfego que entra em um banco de dados em termos de uso de recursos.

Limitações

Essa ferramenta é mais adequada para analisar streams de leituras semelhantes que representam a maior parte do uso da CPU. Não é bom para procurar leituras que foram executadas apenas uma vez.
O uso da CPU rastreado nessas estatísticas representa o uso da CPU do servidor do Spanner, excluindo o uso da CPU de pré-busca e algumas outras sobrecargas.
As estatísticas são coletadas com base no melhor esforço. Como resultado, é possível que as estatísticas sejam perdidas se houver problemas com os sistemas subjacentes. Por exemplo, se houver problemas internos de rede, é possível que algumas estatísticas sejam perdidas.

Acessar estatísticas de leitura

O Spanner fornece as estatísticas de leitura no esquema SPANNER_SYS. Você pode usar as seguintes maneiras para acessar os dados do SPANNER_SYS:

A página do Spanner Studio de um banco de dados no console Google Cloud .
O comando gcloud spanner databases execute-sql.
O método executeSql ou executeStreamingSql.

Os seguintes métodos de leitura única fornecidos pelo Spanner não são compatíveis com SPANNER_SYS:

realizar uma leitura forte de uma única linha ou de várias linhas em uma tabela;
realizar uma leitura desatualizada de uma única linha ou várias linhas em uma tabela;
ler uma única linha ou várias linhas em um índice secundário.

Uso de CPU agrupado por forma de leitura

As tabelas a seguir rastreiam as formas de leitura com o maior uso de CPU durante um período específico:

SPANNER_SYS.READ_STATS_TOP_MINUTE: lê estatísticas de forma agregadas em intervalos de 1 minuto.
SPANNER_SYS.READ_STATS_TOP_10MINUTE: lê estatísticas de forma agregadas em intervalos de 10 minuto.
SPANNER_SYS.READ_STATS_TOP_HOUR: lê estatísticas de forma agregadas em intervalos de 1 hora.

Essas tabelas têm as seguintes propriedades:

Cada uma contém dados para intervalos de tempo não sobrepostos do comprimento que o nome da tabela específica.
Os intervalos são baseados em horas. Os intervalos de 1 minuto terminam no minuto, os de 10 minutos terminam a cada 10 minutos, começando na hora, e os intervalos de 1 hora terminam na hora. Após cada intervalo, o Spanner coleta dados de todos os servidores e disponibiliza os dados nas tabelas SPANNER_SYS pouco tempo depois.

Por exemplo, às 11:59:30, os intervalos mais recentes disponíveis para as consultas SQL são:
- 1 minuto: 11:58:00–11:58:59
- 10 minutos: 11:40:00–11:49:59
- 1 hora: 10:00:00–10:59:59
O Spanner agrupa as estatísticas por forma de leitura. Se uma tag estiver presente, FPRINT será o hash dela. Caso contrário, será o hash do valor READ_COLUMNS.
Cada linha contém estatísticas para todas as execuções de uma forma de leitura específica para que o Spanner captura estatísticas durante o intervalo especificado.
Se o Spanner não puder armazenar informações sobre cada forma de leitura distinta executada durante o intervalo, o sistema priorizará aquelas com o maior uso de CPU durante o intervalo especificado.

Esquema de tabela

Nome da coluna	Tipo	Descrição
`INTERVAL_END`	`TIMESTAMP`	Fim do intervalo de tempo em que as execuções de leitura incluídas ocorreram.
`REQUEST_TAG`	`STRING`	A tag de solicitação opcional para essa operação de leitura. Para mais informações sobre como usar tags, consulte Solução de problemas com tags de solicitação. As estatísticas de várias leituras com a mesma string de tags são agrupadas em uma única linha com "REQUEST_TAG" correspondente a essa string de tag.
`READ_TYPE`	`STRING`	Indica se uma leitura é `PARTITIONED_READ` ou `READ`. Uma leitura com um partitionToken obtido da API PartitionRead é representada pelo tipo de leitura `PARTITIONED_READ` e as outras APIs de leitura por `READ`.
`READ_COLUMNS`	`ARRAY<STRING>`	O conjunto de colunas que foram lidas. Elas estão em ordem alfabética.
`FPRINT`	`INT64`	O hash do valor `REQUEST_TAG`, se presente; Caso contrário, o hash do valor `READ_COLUMNS`.
`EXECUTION_COUNT`	`INT64`	Número de vezes que o Spanner executou a forma de leitura durante o intervalo.
`AVG_ROWS`	`FLOAT64`	Número médio de linhas que a leitura retornou.
`AVG_BYTES`	`FLOAT64`	Número médio de bytes de dados que a leitura retornou, excluindo a sobrecarga de codificação de transmissão.
`AVG_CPU_SECONDS`	`FLOAT64`	Número médio de segundos da CPU do servidor do Spanner executando a leitura, excluindo a CPU de pré-busca e outras sobrecargas.
`AVG_LOCKING_DELAY_SECONDS`	`FLOAT64`	Número médio de segundos gastos em espera devido ao bloqueio.
`AVG_CLIENT_WAIT_SECONDS`	`FLOAT64`	Número médio de segundos gastos em espera porque o cliente não está consumindo dados o mais rápido que o Spanner poderia gerá-los.
`AVG_LEADER_REFRESH_DELAY_SECONDS`	`FLOAT64`	Número médio de segundos gastos esperando a confirmação com o líder do Paxos que todas as gravações foram observadas.
`RUN_IN_RW_TRANSACTION_EXECUTION_COUNT`	`INT64`	O número de vezes que a leitura foi executada como parte de uma transação de leitura/gravação. Essa coluna ajuda a determinar se é possível evitar disputas de bloqueio movendo a leitura para uma transação somente leitura.
`AVG_DISK_IO_COST`	`FLOAT64`	O custo médio dessa consulta em termos de carga de disco do HDD do Spanner. Use esse valor para fazer comparações relativas de custo de E/S de HDD entre leituras executadas no banco de dados. Consultar dados no armazenamento em HDD gera uma cobrança na capacidade de carga do disco HDD da instância. Um valor mais alto indica que você está usando mais carga de disco HDD e que sua consulta pode ser mais lenta do que se estivesse sendo executada em SSD. Além disso, se a carga do disco HDD estiver na capacidade máxima, o desempenho das consultas poderá ser ainda mais afetado. É possível monitorar a capacidade total de carga do disco HDD da instância como uma porcentagem. Para adicionar mais capacidade de carga de disco HDD, adicione mais unidades de processamento ou nós à sua instância. Para mais informações, consulte Mudar a capacidade de computação. Para melhorar o desempenho da consulta, considere também mover alguns dados para um SSD. Para cargas de trabalho que consomem muita E/S de disco, recomendamos armazenar dados acessados com frequência em armazenamento SSD. Os dados acessados do SSD não consomem a capacidade de carga do disco HDD. É possível armazenar tabelas, colunas ou índices secundários seletivos no armazenamento SSD conforme necessário, mantendo os dados acessados com pouca frequência no armazenamento HDD. Para mais informações, consulte Visão geral do armazenamento em níveis.

Exemplo de consultas

Nesta seção, há várias instruções SQL de exemplo que recuperam estatísticas de leitura. É possível executar essas instruções SQL usando as bibliotecas de cliente, o gcloud spanner ou o consoleGoogle Cloud .

Listar as estatísticas básicas de cada forma de leitura em um determinado período

Com a consulta a seguir, você retorna os dados brutos para as principais formas de leitura nos intervalos de tempo de 1 minuto mais recentes.

SELECT fprint,
       read_columns,
       execution_count,
       avg_cpu_seconds,
       avg_rows,
       avg_bytes,
       avg_locking_delay_seconds,
       avg_client_wait_seconds
FROM spanner_sys.read_stats_top_minute
ORDER BY interval_end DESC LIMIT 3;

Saída da consulta

fprint	read_columns	execution_count	avg_cpu_seconds	avg_rows	avg_bytes	avg_locking_delay_seconds	avg_client_wait_seconds
`125062082139`	`["Singers.id", "Singers.name"]`	`8514387`	`0.000661355290396507`	`310.79`	`205`	`8.3232564943763752e-06`	`0`
`151238888745`	`["Singers.singerinfo"]`	`3341542`	`6.5992827184280315e-05`	`12784`	`54`	`4.6859741349028595e-07`	`0`
`14105484`	`["Albums.id", "Albums.title"]`	`9306619`	`0.00017855774721667873`	`1165.4`	`2964.71875`	`1.4328191393074178e-06`	`0`

Listar as formas de leitura pedidas pelo maior uso total da CPU

Com a consulta a seguir, você retorna as formas de leitura com o uso mais alto da CPU na hora mais recente:

SELECT read_columns,
       execution_count,
       avg_cpu_seconds,
       execution_count * avg_cpu_seconds AS total_cpu
FROM spanner_sys.read_stats_top_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.read_stats_top_hour)
ORDER BY total_cpu DESC LIMIT 3;

Saída da consulta

read_columns	execution_count	avg_cpu_seconds	total_cpu
`["Singers.id", "Singers.name"]`	`1647`	`0.00023380297430622681`	`0.2579`
`["Albums.id", "Albums.title"]`	`720`	`0.00016738889440282034`	`0.221314999999999`
`["Singers.singerinfo""]`	`3223`	`0.00037764625882302246`	`0.188053`

Agregar estatísticas

SPANNER_SYS também contém tabelas para armazenar estatísticas de leitura agregadas capturadas pelo Spanner em um período específico:

SPANNER_SYS.READ_STATS_TOTAL_MINUTE: agregar estatísticas de todas as formas de leitura durante intervalos de 1 minuto.
SPANNER_SYS.READ_STATS_TOTAL_10MINUTE: agregar estatísticas de todas as formas de leitura durante intervalos de 10 minutos.
SPANNER_SYS.READ_STATS_TOTAL_HOUR: agregar estatísticas de todas as formas de leitura durante intervalos de 1 hora.

As tabelas de estatísticas agregadas têm as seguintes propriedades:

Cada uma contém dados para intervalos de tempo não sobrepostos do comprimento que o nome da tabela específica.
Os intervalos são baseados em tempos de relógio. Os de 1 minuto terminam no minuto, os de 10 minutos terminam a cada 10 minutos, começando na hora, e os intervalos de 1 hora terminam na hora.

Por exemplo, às 11h59m30s, os intervalos mais recentes disponíveis para consultas SQL em estatísticas de leitura agregadas são:
- 1 minuto: 11:58:00–11:58:59
- 10 minutos: 11:40:00–11:49:59
- 1 hora: 10:00:00–10:59:59
Cada linha contém estatísticas para todas as formas de leitura executadas no banco de dados durante o intervalo especificado, agregadas juntas. Há apenas uma linha por intervalo de tempo.
As estatísticas capturadas nas tabelas SPANNER_SYS.READ_STATS_TOTAL_* podem incluir formas de leitura que o Spanner não capturou nas tabelas SPANNER_SYS.READ_STATS_TOP_*.
Algumas colunas dessas tabelas são expostas como métricas no Cloud Monitoring. As métricas expostas são:
- Contagem de linhas retornadas
- Contagem de execuções de leitura
- Tempo de CPU de leitura
- Atrasos no bloqueio
- Tempo de espera do cliente
- Atraso na atualização do líder
- Contagem de bytes retornados
Para mais informações, consulte Métricas do Spanner.

Esquema de tabela

Nome da coluna	Tipo	Descrição
`INTERVAL_END`	`TIMESTAMP`	Fim do intervalo de tempo em que as execuções de formas de leitura incluídas ocorreram.
`EXECUTION_COUNT`	`INT64`	Número de vezes que o Spanner executou a forma de leitura durante o intervalo.
`AVG_ROWS`	`FLOAT64`	Número médio de linhas que as leituras retornaram.
`AVG_BYTES`	`FLOAT64`	Número médio de bytes de dados que as leituras retornaram, excluindo a sobrecarga de codificação de transmissão.
`AVG_CPU_SECONDS`	`FLOAT64`	Número médio de segundos da CPU do servidor do Spanner executando a leitura, excluindo a CPU de pré-busca e outras sobrecargas.
`AVG_LOCKING_DELAY_SECONDS`	`FLOAT64`	Número médio de segundos gastos em espera devido ao bloqueio.
`AVG_CLIENT_WAIT_SECONDS`	`FLOAT64`	Número médio de segundos gastos em espera devido à limitação.
`AVG_LEADER_REFRESH_DELAY_SECONDS`	`FLOAT64`	Número médio de segundos gastos coordenando as leituras em instâncias em configurações multirregionais.
`RUN_IN_RW_TRANSACTION_EXECUTION_COUNT`	`INT64`	O número de vezes que as leituras foram executadas como parte de transações de leitura e gravação. Essa coluna ajuda a determinar se é possível evitar disputas de bloqueio movendo algumas leituras para transações somente leitura.

Exemplo de consultas

Nesta seção, há várias instruções SQL de exemplo que recuperam estatísticas de leitura agregadas. É possível executar essas instruções SQL usando as bibliotecas de cliente, o gcloud spanner ou o consoleGoogle Cloud .

Encontrar o uso total da CPU em todas as formas de leitura

A consulta a seguir retorna o número de horas de CPU consumidas por formas de leitura na hora mais recente:

SELECT (avg_cpu_seconds * execution_count / 60 / 60)
  AS total_cpu_hours
FROM spanner_sys.read_stats_total_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.read_stats_total_hour);

Saída da consulta

total_cpu_hours
`0.00026186111111111115`

Encontrar a contagem total de execuções em um determinado período

A consulta a seguir retorna o número total de formas de leitura executadas no intervalo completo de 1 minuto mais recente:

SELECT interval_end,
       execution_count
FROM spanner_sys.read_stats_total_minute
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.read_stats_total_minute);

Saída da consulta

interval_end	execution_count
`2020-05-28 11:02:00-07:00`	`12861966`

Retenção de dados

O Spanner mantém dados para cada tabela, no mínimo, pelos períodos a seguir:

SPANNER_SYS.READ_STATS_TOP_MINUTE e SPANNER_SYS.READ_STATS_TOTAL_MINUTE: intervalos que abrangem as seis horas anteriores.
SPANNER_SYS.READ_STATS_TOP_10MINUTE e SPANNER_SYS.READ_STATS_TOTAL_10MINUTE: intervalos abrangendo os quatro dias anteriores.
SPANNER_SYS.READ_STATS_TOP_HOUR e SPANNER_SYS.READ_STATS_TOTAL_HOUR: intervalos que abrangem os últimos 30 dias.

Solucionar problemas de alto uso da CPU com estatísticas de leitura

As estatísticas de leitura do Spanner são úteis em casos em que é necessário investigar o alto uso da CPU no banco de dados do Spanner ou ao tentar entender as formas de leitura pesadas da CPU no banco de dados. A inspeção de formas de leitura que usam quantidades significativas de recursos de banco de dados oferece aos usuários do Spanner uma maneira potencial de reduzir os custos operacionais e possivelmente melhorar as latências gerais do sistema. Nas etapas a seguir, mostraremos como usar estatísticas de leitura para investigar o alto uso da CPU no banco de dados.

Selecionar um período para investigar

Inicie a investigação procurando um horário em que o aplicativo começou a apresentar uso elevado da CPU. Por exemplo, no cenário a seguir, o problema começou a ocorrer por volta das 17h20 no dia 28 de maio de 2020.

Coletar estatísticas de leitura para o período selecionado

Depois de selecionar um período para iniciar nossa investigação, analisaremos as estatísticas coletadas na tabela READ_STATS_TOTAL_10MINUTE desse período. Os resultados dessa consulta podem dar pistas sobre como a CPU e outras estatísticas de leitura mudaram nesse período. A consulta a seguir retorna as estatísticas de leitura agregadas de 4:30 pm a 7:30 pm (inclusive).

SELECT
  interval_end,
  ROUND(avg_cpu_seconds,4) as avg_cpu_seconds,
  execution_count,
  avg_locking_delay_seconds
FROM SPANNER_SYS.READ_STATS_TOTAL_10MINUTE
WHERE
  interval_end >= "2020-05-28T16:30:00"
  AND interval_end <= "2020-05-28T19:30:00"
ORDER BY interval_end;

Os dados a seguir são um exemplo do resultado que recebemos da nossa consulta.

interval_end	avg_cpu_seconds	execution_count	avg_locking_delay_seconds
2020-05-28 16:40:00-07:00	0.0004	11111421	8.3232564943763752e-06
2020-05-28 16:50:00-07:00	0.0002	8815637	8.98734051776406e-05
2020-05-28 17:00:00-07:00	0.0001	8260215	6.039129247846453e-06
2020-05-28 17:10:00-07:00	0.0001	8514387	9.0535466616680686e-07
2020-05-28 17:20:00-07:00	0.0006	13715466	2.6801485272173765e-06
2020-05-28 17:30:00-07:00	0.0007	12861966	4.6859741349028595e-07
2020-05-28 17:40:00-07:00	0.0007	3755954	2.7131391918005383e-06
2020-05-28 17:50:00-07:00	0.0006	4248137	1.4328191393074178e-06
2020-05-28 18:00:00-07:00	0.0006	3986198	2.6973481999639748e-06
2020-05-28 18:10:00-07:00	0.0006	3510249	3.7577083563017905e-06
2020-05-28 18:20:00-07:00	0.0004	3341542	4.0940589703795433e-07
2020-05-28 18:30:00-07:00	0.0002	8695147	1.9914494947583975e-05
2020-05-28 18:40:00-07:00	0.0003	11679702	1.8331461539001595e-05
2020-05-28 18:50:00-07:00	0.0003	9306619	1.2527332321222135e-05
2020-05-28 19:00:00-07:00	0.0002	8520508	6.2268448078447915e-06
2020-05-28 19:10:00-07:00	0.0006	13715466	2.6801485272173765e-06
2020-05-28 19:20:00-07:00	0.0005	11947323	3.3029114639321295e-05
2020-05-28 19:30:00-07:00	0.0002	8514387	9.0535466616680686e-07

Observe que o tempo médio da CPU, avg_cpu_seconds, é maior nos intervalos destacados. O interval_end com o valor 2020-05-28 19:20:00 tem um tempo de CPU maior. Por isso, escolhemos esse intervalo para investigar mais na próxima etapa.

Descobrir quais formas de leitura estão causando alto uso da CPU

Ao se aprofundar mais, consultamos a tabela READ_STATS_TOP_10MINUTE sobre o intervalo escolhido na etapa anterior. Os resultados dessa consulta podem ajudar a indicar quais formas de leitura causam alto uso da CPU.

SELECT
  read_columns,
  ROUND(avg_cpu_seconds,4) as avg_cpu_seconds,
  execution_count,
  avg_rows
FROM SPANNER_SYS.READ_STATS_TOP_10MINUTE
WHERE
  interval_end = "2020-05-28T19:20:00"
ORDER BY avg_cpu_seconds DESC LIMIT 3;

Os dados a seguir são um exemplo do resultado que recebemos da nossa consulta, retornando informações sobre as três principais formas de leitura classificadas por avg_cpu_seconds. Observe o uso de ROUND em nossa consulta para restringir a saída de avg_cpu_seconds a 4 casas decimais.

read_columns	avg_cpu_seconds	execution_count	avg_rows
`[TestHigherLatency._exists,TestHigherLatency.lang_status,TestHigherLatency.score,globalTagAffinity.shares]`¹	0.4192	1182	11650.42216582
`[TestHigherLatency._exists,TestHigherLatency.lang_status,TestHigherLatency.likes,globalTagAffinity.score]`	0.0852	4	12784
`[TestHigherLatency._exists,TestHigherLatency.lang_status,TestHigherLatency.score,globalTagAffinity.ugcCount]`	0.0697	1140	310.7921052631

¹ _exists é um campo interno usado para verificar se uma determinada linha existe ou não.

Um motivo para o alto uso da CPU pode ser que você comece a executar algumas formas de leitura com mais frequência (execution_count). Talvez o número médio de linhas que a leitura retornou aumentou (avg_rows). Se nenhuma dessas propriedades da forma de leitura revelar algo interessante, você poderá examinar outras propriedades como avg_locking_delay_seconds, avg_client_wait_seconds ou avg_bytes.

Aplicar práticas recomendadas para reduzir o alto uso da CPU

Depois de concluir as etapas anteriores, pense se fornecer alguma destas práticas recomendadas ajudará sua situação.

O número de vezes que o Spanner executou formas de leitura durante o intervalo é um bom exemplo de uma métrica que precisa de uma linha de base para informar se uma medição é razoável ou um sinal de um problema. Após estabelecer uma linha de base para a métrica, será possível detectar e investigar a causa de um desvio inesperado de comportamento normal.
Se o uso da CPU for relativamente constante na maioria das vezes, mas repentinamente mostrar um pico que possa ser correlacionado com um pico repentino semelhante nas solicitações de usuários ou no comportamento do aplicativo, pode ser uma indicação de que tudo está funcionando como esperado.
Faça a seguinte consulta para encontrar as principais formas de leitura classificadas pelo número de vezes que o Spanner foi executado para cada forma de leitura:
```
SELECT interval_end, read_columns, execution_count
FROM SPANNER_SYS.READ_STATS_TOP_MINUTE
ORDER BY execution_count DESC
LIMIT 10;
```
Se você estiver procurando as latências de leitura mais baixas possíveis, especialmente ao usar configurações de instância multirregionais, use leituras desatualizadas em vez de leituras fortes para reduzir ou remover o componente AVG_LEADER_REFRESH_DELAY_SECONDS de latência de leitura.

Observação: as leituras desatualizadas não oferecem qualquer benefício de latência em configurações regionais. Portanto, quase sempre é melhor usar leituras fortes quando a instância não tiver configuração multirregional.
Se você está apenas fazendo leituras e pode expressá-las usando um método de leitura única, use esse método. As leituras únicas não são bloqueadas, ao contrário das transações de leitura e gravação. Portanto, use transações somente leitura em vez de transações de leitura e gravação mais caras quando você não estiver gravando dados.

A seguir

Saiba mais sobre outras ferramentas de introspecção.
Saiba mais sobre outras informações que o Spanner armazena para cada banco de dados nas tabelas de esquema de informações do banco de dados.
Saiba mais sobre as práticas recomendadas de SQL para o Spanner.
Saiba mais sobre como investigar a alta utilização da CPU.