Usar o painel do Cloud Monitoring

Esta página descreve como usar o painel do Cloud Monitoring para conferir as métricas disponíveis, criar um painel personalizado e definir alertas.

Conferir as métricas do Firestore no modo Datastore

Para conferir as diferentes métricas do Firestore no modo Datastore e criar gráficos, use o Metrics Explorer no Cloud Monitoring no console do Google Cloud . Para mais informações sobre como criar gráficos, consulte Criar gráficos com o Metrics Explorer.

Configurar um painel do Cloud Monitoring

No Cloud Monitoring, os painéis personalizados permitem mostrar informações relevantes de maneira organizada. Por exemplo, você pode criar um painel para mostrar as métricas de desempenho e as políticas de alerta do projeto no ambiente de produção.

Para mais informações sobre como configurar um painel personalizado, consulte Gerenciar painel personalizado e Adicionar widgets de painel.

Monitorar as taxas de erro

É possível criar um painel de monitoramento para monitorar as taxas de erro e garantir a disponibilidade do banco de dados. A disponibilidade se refere à taxa em que o banco de dados responde dentro de um período esperado com um código de status. O SLA do Cloud Firestore no modo Datastore define os detalhes específicos do que é classificado como uma solicitação válida.

A taxa de erros é determinada dividindo o número de solicitações que resultaram em uma resposta de erro pelo número total de solicitações enviadas.

É possível criar um painel de exemplo para calcular as taxas de erro calculando a proporção A/B para api/request_count de solicitações válidas com códigos de erro 4xx ou 5xx em contraste com a api/request_count de todas as solicitações válidas.

 Entender a disponibilidade com a taxa de erros
Figura 1. Entenda a disponibilidade com a taxa de erros.

Na Figura 1, você pode conferir como visualizar a proporção da taxa de erros usando as métricas api/request_count no Metrics Explorer.

Crie uma política de alertas

Com o Cloud Monitoring, você pode criar alertas para receber notificações quando ocorrer uma mudança em uma condição de métrica. Você pode usar esses alertas para receber notificações sobre possíveis problemas antes que eles afetem os usuários.

Para mais informações sobre como criar alertas, consulte Criar políticas de alertas de limite de métrica.

Considere o exemplo a seguir em que criamos uma política de alerta de latência. A política de alertas verifica a latência do P99 em uma janela contínua de cinco minutos. Se a latência p99 permanecer acima de 250 ms por cinco minutos, o alerta será acionado.

Console

  1. No console Google Cloud , acesse a página Monitoramento e selecione  Alertas.

    Acessar Monitoring

  2. Selecione Criar política.

  3. Selecione a métrica Latências de solicitação no recurso API utilizada.

  4. Adicione um filtro de serviço para datastore.googleapis.com. A métrica api/request_latencies é monitorada durante a janela de 5 minutos.

    Selecione a métrica "api/request_latencies" para criar o acionador.
    Figura 2. Selecione a métrica api/request_latencies para criar o acionador.
  5. Clique em Próxima para configurar o acionador.

  6. Selecione Tipos de condição como Limite.

    Uma condição de limite é definida como um valor de 250 ms. Um alerta é acionado quando o valor da latência p99 permanece o mesmo durante todo o período da janela contínua (5 minutos).

    Adicione o limite da métrica.
    Figura 3. Adicione o limite da métrica.
  7. Defina o Valor do limite como 250.

  8. Clique em Próxima para configurar as notificações.

  9. Defina o nome da política de alertas e clique em Próxima.

  10. Revise as configurações de alerta e clique em Criar política.

MQL

É possível implementar a mesma política de alerta de latência usando uma consulta de linguagem de consulta de monitoramento (MQL). Para mais exemplos de uso do MQL, consulte Exemplos de consultas MQL.

      fetch consumed_api
      | metric 'serviceruntime.googleapis.com/api/request_latencies'
      | filter (resource.service == 'firestore.googleapis.com')
      | group_by 5m,
          [value_request_latencies_percentile:
            percentile(value.request_latencies, 99)]
      | every 5m
      | condition val() > 0.25 's'