Este documento descreve como usar o console do Cloud Monitoring para monitorar suas instâncias do Spanner.
O console do Cloud Monitoring oferece várias ferramentas de monitoramento para o Spanner:
- Um painel de controle selecionado, que mostra gráficos pré-criados para seus recursos do Spanner.
- Gráficos personalizados, incluindo gráficos ad hoc no Metrics Explorer, além de gráficos em painéis personalizados.
- Alertas, que notificam você se uma métrica excede um limite especificado.
Se você preferir monitorar o Spanner de maneira programática, use as bibliotecas de cliente do Cloud para o Cloud Monitoring para extrair métricas.
Usar o painel selecionado do Cloud Monitoring
O Cloud Monitoring oferece um painel selecionado que resume as principais informações sobre suas instâncias do Spanner, incluindo:
- Incidentes: alertas de monitoramento criados pelo usuário que estão abertos, ativos ou resolvidos.
- Eventos: uma lista de registros de auditoria do Spanner, se ativados e disponíveis.
- Instâncias: um resumo detalhado das instâncias do Spanner, incluindo capacidade de computação, número de bancos de dados e integridade das instâncias.
- Gráficos agregados de capacidade e uso de armazenamento.
Para acessar o painel do Spanner, faça o seguinte:
No console do Google Cloud , selecione Monitoring ou use o botão a seguir:
Se Recursos for mostrado no painel de navegação, selecione Recursos e, em seguida, Cloud Spanner. Caso contrário, selecione Painéis e, em seguida, selecione o painel chamado Cloud Spanner.
Conferir detalhes da instância e do banco de dados
Quando você abre o painel de controle do Spanner, ele mostra dados agregados de todas as suas instâncias. Para ver mais detalhes sobre uma instância específica, clique no nome dela em Instâncias.
O painel exibe informações, como metadados da instância, bancos de dados incluídos nela e gráficos de várias métricas detalhadas por região.
Na página do painel da instância, também é possível ver os gráficos de um banco de dados específico na instância:
No lado direito, acima dos gráficos de métricas da instância, clique em Métricas do banco de dados.
Na lista suspensa Selecionar um detalhamento, selecione o banco de dados a ser examinado.
O console do Cloud Monitoring exibe gráficos do banco de dados.
Criar gráficos personalizados para métricas do Spanner
Você pode usar o Cloud Monitoring para criar gráficos personalizados de métricas do Spanner. Também é possível usar o Metrics Explorer para criar gráficos temporários, ad-hoc ou que aparecem em painéis personalizados.
Especificamente, o Cloud Monitoring permite criar um gráfico personalizado que mostra se duas ou mais métricas estão correlacionadas. Por exemplo, é possível verificar uma correlação entre a utilização de CPU e a latência em uma instância do Spanner, o que pode indicar que sua instância precisa de mais capacidade de computação ou que algumas consultas estão causando alta utilização da CPU.
Para começar a usar esse exemplo, siga estas etapas:
No console do Google Cloud , selecione Monitoring ou use o botão a seguir:
Se o Metrics Explorer for mostrado no painel de navegação, selecione-o. Caso contrário, selecione Recursos e, em seguida, Metrics Explorer.
Clique na guia Opções de visualização e marque a caixa de seleção Escala do registro no eixo Y. Essa opção ajuda você a comparar várias métricas quando uma delas tem valores muito maiores do que as outras.
Na lista suspensa acima do painel direito, selecione Linha.
Clique na guia Métricas. Agora é possível adicionar métricas ao gráfico.
Para adicionar métricas de latência ao gráfico, siga estas etapas:
- Na caixa Localizar tipo de recurso e métrica, insira o valor
spanner.googleapis.com/api/request_latencies
e clique na linha exibida abaixo da caixa. - Na caixa Filtro, insira o valor
instance_id
e, em seguida, o ID da instância a ser examinada e clique em Aplicar. - Na lista suspensa Agregador, clique em máx.
Se preferir, altere o percentil de latência:
- Clique em Mostrar opções avançadas.
Clique na lista suspensa Alinhador e, em seguida, no percentil de latência que você quer visualizar.
Na maioria dos casos, você observa a latência do 50º percentil para entender a latência típica ou a latência do 99º percentil para entender a latência do 1% mais lento das solicitações.
Para adicionar métricas de utilização da CPU ao gráfico, siga estas etapas:
- Clique em Adicionar métrica.
- Na caixa Localizar tipo de recurso e métrica, insira o valor
spanner.googleapis.com/instance/cpu/utilization
e clique na linha exibida abaixo da caixa. - Na caixa Filtro, insira o valor
instance_id
e, em seguida, o ID da instância a ser examinada e clique em Aplicar. - Na lista suspensa Agregador, clique em máx.
Agora você tem um gráfico que mostra a utilização da CPU e as métricas de latência de uma instância do Spanner. Se as duas métricas forem maiores que o esperado ao mesmo tempo, será possível realizar etapas adicionais para corrigir o problema.
Para mais informações sobre como criar gráficos personalizados, consulte a documentação do Cloud Monitoring.
Criar alertas para métricas do Spanner
Ao criar uma instância do Spanner, você escolhe a capacidade de computação dela. Conforme a carga de trabalho da instância muda, o Spanner não ajusta automaticamente a capacidade de computação da instância. Como resultado, você precisa configurar diversos alertas para garantir que a instância permaneça dentro dos valores máximos recomendados para utilização da CPU e do limite de armazenamento recomendado.
Os exemplos a seguir mostram como configurar políticas de alertas para algumas métricas do Spanner. Para uma lista completa das métricas disponíveis, consulte a lista de métricas do Spanner.
CPU de prioridade alta
Para criar uma política de alertas que é acionada quando o uso de CPU de alta prioridade para o Spanner está acima do limite recomendado, use as seguintes configurações.
Novo estado Campo |
Valor |
---|---|
Recurso e métrica | No menu Resources, selecione Spanner Instance. No menu Categorias de métrica, selecione Instância. No menu Métricas, selecione Utilização de CPU por prioridade. O metric.type é spanner.googleapis.com/instance/cpu/utilization_by_priority .
|
Filtrar | instance_id = YOUR_INSTANCE_ID priority = high
|
Séries cruzadas Série temporal agrupada por |
location para instâncias multirregionais. Deixe em branco para instâncias regionais. |
Várias séries Agregação de série temporal |
sum |
Janela contínua | 10 m |
Função de janela contínua | mean |
Campo Configurar gatilho de alerta |
Valor |
---|---|
Tipo de condição | Threshold |
Acionador de alerta | Any time series violates |
Posição do limite | Above threshold |
Valor do limite | 45% para instâncias multirregionais. 65% para instâncias regionais. |
Teste a janela novamente | 10 minutes |
CPU em média contínua de 24 horas
Para criar uma política de alertas que é acionada quando a média contínua de 24 horas de utilização da CPU para o Spanner está acima do limite recomendado, use as seguintes configurações.
Novo estado Campo |
Valor |
---|---|
Recurso e métrica | No menu Resources, selecione Spanner Instance. No menu Categorias de métrica, selecione Instância. No menu Métricas, selecione Utilização da CPU suavizada. O metric.type é spanner.googleapis.com/instance/cpu/smoothed_utilization .
|
Filtrar | instance_id = YOUR_INSTANCE_ID |
Várias séries Agregação de série temporal |
sum |
Janela contínua | 10 m |
Função de janela contínua | mean |
Campo Configurar gatilho de alerta |
Valor |
---|---|
Tipo de condição | Threshold |
Acionador de alerta | Any time series violates |
Posição do limite | Above threshold |
Limite | 90%
|
Teste a janela novamente | 10 minutes |
Armazenamento
Para criar uma política de alertas que é acionada quando o armazenamento da sua instância do Spanner está acima do limite recomendado, use as seguintes configurações:
Novo estado Campo |
Valor |
---|---|
Recurso e métrica | No menu Resources, selecione Spanner Instance. No menu Categorias de métrica, selecione Instância. No menu Métricas, selecione Armazenamento usado. O metric.type é spanner.googleapis.com/instance/storage/utilization .
|
Filtrar | instance_id = YOUR_INSTANCE_ID |
Várias séries Agregação de série temporal |
sum |
Janela contínua | 10 m |
Função de janela contínua | max |
Campo Configurar gatilho de alerta |
Valor |
---|---|
Tipo de condição | Threshold |
Condition triggers if | Any time series violates |
Posição do limite | Above threshold |
Valor do limite | Não é necessário definir um limite específico para o armazenamento máximo por nó. No entanto, recomendamos configurar um alerta quando você estiver se aproximando do limite máximo de armazenamento. Para saber mais, consulte Métricas de utilização do armazenamento. |
Teste a janela novamente | 10 minutes |
A seguir
- Entenda as métricas de uso da CPU e latência do Spanner.
- Use o console do para uma visualização rápida das métricas mais importantes da sua instância.
- Saiba mais sobre o Cloud Monitoring.