Como monitorar com o Cloud Monitoring

Neste documento, descrevemos como usar o console do Cloud Monitoring para monitorar as instâncias do Cloud Spanner.

O console do Cloud Monitoring oferece várias ferramentas de monitoramento para o Cloud Spanner:

Se você preferir monitorar o Cloud Spanner de maneira programática, use as bibliotecas de cliente do Cloud para o Cloud Monitoring para recuperar métricas.

Antes de começar

Para usar o Cloud Monitoring, você precisa ter um espaço de trabalho. Se você não tiver um espaço de trabalho, crie um espaço de trabalho novo.

Como usar o painel selecionado do Cloud Monitoring

O Cloud Monitoring fornece um painel selecionado que resume as principais informações sobre as instâncias do Cloud Spanner, incluindo:

  • Incidentes: alertas de monitoramento criados pelo usuário que estão abertos, ativos ou resolvidos.
  • Eventos: uma lista de registros de auditoria do Cloud Spanner, se ativados e disponíveis.
  • Instâncias: um resumo detalhado das instâncias do Cloud Spanner, incluindo contagem de nós, número de bancos de dados e integridade das instâncias.
  • Gráficos agregados de capacidade e uso de armazenamento.

Para visualizar o painel do Cloud Spanner, faça o seguinte:

  1. No Console do Google Cloud, selecione Monitoramento ou use este botão:

    Acessar Monitoring (em inglês)

  2. Se Recursos for mostrado no painel de navegação, selecione Recursos e, em seguida, Cloud Spanner. Caso contrário, selecione Painéis e, em seguida, selecione o painel chamado Cloud Spanner.

Como ver detalhes da instância e do banco de dados

Quando você abre o painel de controle do Cloud Spanner, ele mostra dados agregados de todas as suas instâncias. Para ver mais detalhes sobre uma instância específica, clique no nome dela em Instâncias.

O painel exibe informações, como metadados da instância, bancos de dados incluídos nela e gráficos de várias métricas detalhadas por região.

Na página do painel da instância, também é possível ver os gráficos de um banco de dados específico na instância:

  1. No lado direito, acima dos gráficos de métricas da instância, clique em Métricas do banco de dados.

  2. Na lista suspensa Selecionar um detalhamento, selecione o banco de dados a ser examinado.

    O console do Monitoring exibe gráficos do banco de dados.

Como criar gráficos personalizados para as métricas do Cloud Spanner

Você pode usar o Cloud Monitoring para criar gráficos personalizados de métricas do Cloud Spanner. Também é possível usar o Metrics Explorer para criar gráficos temporários, ad-hoc ou que aparecem em painéis personalizados.

Em particular, o Cloud Monitoring permite criar um gráfico personalizado que mostra se duas ou mais métricas estão correlacionadas. Por exemplo, é possível verificar uma correlação entre a utilização de CPU e a latência em uma instância do Cloud Spanner, o que pode indicar que sua instância precisa de mais nós ou que algumas consultas estão causando alta utilização da CPU.

Para começar a usar esse exemplo, siga estas etapas:

  1. No Console do Google Cloud, selecione Monitoramento ou use este botão:

    Acessar Monitoring (em inglês)

  2. Se o Metrics Explorer for mostrado no painel de navegação, selecione-o. Caso contrário, selecione Recursos e, em seguida, Metrics Explorer.

  3. Clique na guia Opções de visualização e marque a caixa de seleção Escala do registro no eixo Y. Essa opção ajuda você a comparar várias métricas quando uma delas tem valores muito maiores do que as outras.

  4. Na lista suspensa acima do painel direito, selecione Linha.

  5. Clique na guia Métricas. Agora é possível adicionar métricas ao gráfico.

Para adicionar métricas de latência ao gráfico, siga estas etapas:

  1. Na caixa Localizar tipo de recurso e métrica, insira o valor spanner.googleapis.com/api/request_latencies e clique na linha exibida abaixo da caixa.
  2. Na caixa Filtro, insira o valor instance_id e, em seguida, o ID da instância a ser examinada e clique em Aplicar.
  3. Na lista suspensa Agregador, clique em máx.
  4. Se preferir, altere o percentil de latência:

    1. Clique em Mostrar opções avançadas.
    2. Clique na lista suspensa Alinhador e, em seguida, no percentil de latência que você quer visualizar.

      Na maioria dos casos, você observa a latência do 50º percentil para entender a latência típica ou a latência do 99º percentil para entender a latência do 1% mais lento das solicitações.

Para adicionar métricas de utilização da CPU ao gráfico, siga estas etapas:

  1. Clique em add Adicionar métrica.
  2. Na caixa Localizar tipo de recurso e métrica, insira o valor spanner.googleapis.com/instance/cpu/utilization e clique na linha exibida abaixo da caixa.
  3. Na caixa Filtro, insira o valor instance_id e, em seguida, o ID da instância a ser examinada e clique em Aplicar.
  4. Na lista suspensa Agregador, clique em máx.

Agora você tem um gráfico que mostra a utilização da CPU e as métricas de latência de uma instância do Cloud Spanner. Se as duas métricas forem maiores que o esperado ao mesmo tempo, será possível realizar etapas adicionais para corrigir o problema.

Para mais informações sobre como criar gráficos personalizados, consulte a documentação do Cloud Monitoring.

Como criar alertas para as métricas do Cloud Spanner

Ao criar uma instância do Cloud Spanner, escolha o número de nós que fornecem recursos de computação para a instância. Conforme a carga de trabalho da instância é alterada, o Cloud Spanner não ajusta automaticamente o número de nós na instância. Como resultado, você precisa configurar diversos alertas para garantir que a instância permaneça dentro dos valores máximos recomendados para utilização da CPU e do limite de armazenamento recomendado por nó.

Para criar as políticas de alerta recomendadas, use as instruções e configurações exibidas na tabela a seguir:

CPU de prioridade alta

Para criar uma política de alertas que é acionada quando o uso de CPU de alta prioridade para o Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric CPU Utilization by priority
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Aggregator max
Advanced Aggregation Aligner: mean
Alignment Period: 10 m
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/cpu/utilization_by_priority.
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 45% para instâncias multirregionais.
65% para instâncias regionais.
For 10 minutes

CPU em média contínua de 24 horas

Para criar uma política de alertas que é acionada quando a média contínua de 24 horas de utilização da CPU para o Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric Smoothed CPU utilization
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Advanced Aggregation Aligner: mean
Alignment Period: 10 m
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/cpu/smoothed_utilization.
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 90%
For 10 minutes

Armazenamento

Para criar uma política de alertas que é acionada quando o armazenamento da sua instância do Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric Storage used
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 10 m
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/storage/used_bytes.
Campo do painel
Condições

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Defina o limite para 75% do armazenamento máximo por nó, multiplicado pelo número de nós. Para os limites de nó atuais, consulte Cotas e limites do Cloud Spanner.

Para um limite de 2 TB por nó, o limite recomendado é:

1649267441664 multiplicado pelo número de nós na instância.
For 10 minutes

A seguir