Como monitorar com o Cloud Monitoring

Neste documento, descrevemos como usar o console do Cloud Monitoring para monitorar as instâncias do Cloud Spanner.

O console do Cloud Monitoring oferece várias ferramentas de monitoramento para o Cloud Spanner:

Se você preferir monitorar o Cloud Spanner de maneira programática, use as bibliotecas de cliente do Cloud para o Cloud Monitoring para recuperar métricas.

Como usar o painel selecionado do Cloud Monitoring

O Cloud Monitoring fornece um painel selecionado que resume as principais informações sobre as instâncias do Cloud Spanner, incluindo:

  • Incidentes: alertas de monitoramento criados pelo usuário que estão abertos, ativos ou resolvidos.
  • Eventos: uma lista de registros de auditoria do Cloud Spanner, se ativados e disponíveis.
  • Instâncias: um resumo de alto nível das instâncias do Cloud Spanner, incluindo capacidade de computação, contagem do banco de dados e integridade da instância
  • Gráficos agregados de capacidade e uso de armazenamento.

Para visualizar o painel do Cloud Spanner, faça o seguinte:

  1. No Console do Google Cloud, selecione Monitoring ou use este botão:

    Acessar Monitoring

  2. Se Recursos for mostrado no painel de navegação, selecione Recursos e, em seguida, Cloud Spanner. Caso contrário, selecione Painéis e, em seguida, selecione o painel chamado Cloud Spanner.

Como ver detalhes da instância e do banco de dados

Quando você abre o painel de controle do Cloud Spanner, ele mostra dados agregados de todas as suas instâncias. Para ver mais detalhes sobre uma instância específica, clique no nome dela em Instâncias.

O painel exibe informações, como metadados da instância, bancos de dados incluídos nela e gráficos de várias métricas detalhadas por região.

Na página do painel da instância, também é possível ver os gráficos de um banco de dados específico na instância:

  1. No lado direito, acima dos gráficos de métricas da instância, clique em Métricas do banco de dados.

  2. Na lista suspensa Selecionar um detalhamento, selecione o banco de dados a ser examinado.

    O console do Monitoring exibe gráficos do banco de dados.

Como criar gráficos personalizados para as métricas do Cloud Spanner

Você pode usar o Cloud Monitoring para criar gráficos personalizados de métricas do Cloud Spanner. Também é possível usar o Metrics Explorer para criar gráficos temporários, ad-hoc ou que aparecem em painéis personalizados.

Em particular, o Cloud Monitoring permite criar um gráfico personalizado que mostra se duas ou mais métricas estão correlacionadas. Por exemplo, é possível verificar uma correlação entre a utilização da CPU e a latência em uma instância do Cloud Spanner, o que pode indicar que sua instância precisa mais capacidade de computação ou que algumas das suas consultas estão causando alta utilização da CPU.

Para começar a usar esse exemplo, siga estas etapas:

  1. No Console do Google Cloud, selecione Monitoring ou use este botão:

    Acessar Monitoring

  2. Se o Metrics Explorer for mostrado no painel de navegação, selecione-o. Caso contrário, selecione Recursos e, em seguida, Metrics Explorer.

  3. Clique na guia Opções de visualização e marque a caixa de seleção Escala do registro no eixo Y. Essa opção ajuda você a comparar várias métricas quando uma delas tem valores muito maiores do que as outras.

  4. Na lista suspensa acima do painel direito, selecione Linha.

  5. Clique na guia Métricas. Agora é possível adicionar métricas ao gráfico.

Para adicionar métricas de latência ao gráfico, siga estas etapas:

  1. Na caixa Localizar tipo de recurso e métrica, insira o valor spanner.googleapis.com/api/request_latencies e clique na linha exibida abaixo da caixa.
  2. Na caixa Filtro, insira o valor instance_id e, em seguida, o ID da instância a ser examinada e clique em Aplicar.
  3. Na lista suspensa Agregador, clique em máx.
  4. Se preferir, altere o percentil de latência:

    1. Clique em Mostrar opções avançadas.
    2. Clique na lista suspensa Alinhador e, em seguida, no percentil de latência que você quer visualizar.

      Na maioria dos casos, você observa a latência do 50º percentil para entender a latência típica ou a latência do 99º percentil para entender a latência do 1% mais lento das solicitações.

Para adicionar métricas de utilização da CPU ao gráfico, siga estas etapas:

  1. Clique em Adicionar métrica.
  2. Na caixa Localizar tipo de recurso e métrica, insira o valor spanner.googleapis.com/instance/cpu/utilization e clique na linha exibida abaixo da caixa.
  3. Na caixa Filtro, insira o valor instance_id e, em seguida, o ID da instância a ser examinada e clique em Aplicar.
  4. Na lista suspensa Agregador, clique em máx.

Agora você tem um gráfico que mostra a utilização da CPU e as métricas de latência de uma instância do Cloud Spanner. Se as duas métricas forem maiores que o esperado ao mesmo tempo, será possível realizar etapas adicionais para corrigir o problema.

Para mais informações sobre como criar gráficos personalizados, consulte a documentação do Cloud Monitoring.

Como criar alertas para as métricas do Cloud Spanner

Ao criar uma instância do Cloud Spanner, você escolhe a capacidade de computação da instância. As medida que a carga de trabalho da instância é alterada, o Cloud Spanner não ajusta automaticamente a capacidade de computação da instância. Como resultado, você precisa configurar vários alertas para garantir que a instância permaneça dentro dos máximos recomendados para utilização da CPU e do limite recomendado para armazenamento de dados.

Os exemplos a seguir mostram como configurar políticas de alertas para algumas métricas do Cloud Spanner. Para uma lista completa de métricas disponíveis, consulte lista de métricas do Cloud Spanner.

CPU de prioridade alta

Para criar uma política de alertas que é acionada quando o uso de CPU de alta prioridade para o Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric CPU Utilization by priority
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Group By location para instâncias multirregionais
deixe em branco para instâncias regionais.
Aggregator sum
Period 10 m
Aligner mean
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/cpu/utilization_by_priority.
Campo do painel
Configuração

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 45% para instâncias multirregionais.
65% para instâncias regionais.
For 10 minutes

CPU em média contínua de 24 horas

Para criar uma política de alertas que é acionada quando a média contínua de 24 horas de utilização da CPU para o Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric Smoothed CPU utilization
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Period 10 m
Aligner mean
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/cpu/smoothed_utilization.
Campo do painel
Configuração

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 90%
For 10 minutes

Armazenamento

Para criar uma política de alertas que é acionada quando o armazenamento da sua instância do Cloud Spanner está acima do limite recomendado, use as seguintes configurações:

Campo do painel
Valor desejado

Valor
Resource type* Cloud Spanner Instance
Metric Storage used
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Period 10 m
Aligner max
* A seleção desse tipo de recurso e métrica equivale a inserir o seguinte valor no painel Encontrar tipo de recurso e métrica: spanner.googleapis.com/instance/storage/used_bytes.
Campo do painel
Configuração

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Defina o limite para 75% do armazenamento máximo por nó, multiplicado pelo número de nós. Para os limites de nó atuais, consulte Cotas e limites do Cloud Spanner.

Para um limite de 2 TB por nó, o limite recomendado é o número de bytes em 1,5 TB:

1649267441664 multiplicado pelo número de nós na instância.
For 10 minutes

A seguir