Este documento descreve como usar o console do Cloud Monitoring para monitorar suas instâncias do Spanner.
O console do Cloud Monitoring oferece várias ferramentas de monitoramento para o Spanner:
- Um painel selecionado, que mostra gráficos pré-criados para o Spanner recursos
- Gráficos personalizados, incluindo gráficos ad hoc no Metrics Explorer, além de gráficos em painéis personalizados.
- Alertas, que notificam você se uma métrica excede um limite especificado.
Se você preferir monitorar o Spanner de maneira programática, use a API Cloud Client Bibliotecas para o Cloud Monitoring recuperar métricas.
Usar o painel selecionado do Cloud Monitoring
O Cloud Monitoring oferece um painel selecionado que resume as principais informações sobre suas instâncias do Spanner, incluindo:
- Incidentes: alertas de monitoramento criados pelo usuário que estão abertos, ativos ou resolvidos.
- Eventos: uma lista de registros de auditoria do Spanner, se ativados e disponíveis.
- Instâncias: um resumo detalhado das instâncias do Spanner, incluindo capacidade de computação, contagem de bancos de dados e integridade da instância
- Gráficos agregados de capacidade e uso de armazenamento.
Para acessar o painel do Spanner, faça o seguinte:
No Console do Google Cloud, selecione Monitoring ou use este botão:
Se Recursos for mostrado no painel de navegação, selecione Recursos e, em seguida, Cloud Spanner. Caso contrário, selecione Painéis e, em seguida, selecione o painel chamado Cloud Spanner.
Mais detalhes da instância e do banco de dados
Quando você abre o painel selecionado do Spanner, ele mostra os dados de todas as instâncias. Para ver mais detalhes sobre uma instância específica, clique no nome dela em Instâncias.
O painel exibe informações, como metadados da instância, bancos de dados incluídos nela e gráficos de várias métricas detalhadas por região.
Na página do painel da instância, também é possível ver os gráficos de um banco de dados específico na instância:
No lado direito, acima dos gráficos de métricas da instância, clique em Métricas do banco de dados.
Na lista suspensa Selecionar um detalhamento, selecione o banco de dados a ser examinado.
O console do Cloud Monitoring exibe gráficos do banco de dados.
Criar gráficos personalizados para métricas do Spanner
Você pode usar o Cloud Monitoring para criar gráficos personalizados de métricas do Spanner. Também é possível usar o Metrics Explorer para criar gráficos temporários, ad-hoc ou que aparecem em painéis personalizados.
Especificamente, o Cloud Monitoring permite criar um gráfico personalizado que mostra se duas ou mais métricas estão correlacionadas. Por exemplo, é possível verificar uma correlação entre a utilização de CPU e a latência em uma instância do Spanner, o que pode indicar que sua instância precisa de mais capacidade de computação ou que algumas consultas estão causando alta utilização da CPU.
Para começar a usar esse exemplo, siga estas etapas:
No Console do Google Cloud, selecione Monitoring ou use este botão:
Se o Metrics Explorer for mostrado no painel de navegação, selecione-o. Caso contrário, selecione Recursos e, em seguida, Metrics Explorer.
Clique na guia Opções de visualização e marque a caixa de seleção Escala do registro no eixo Y. Essa opção ajuda você a comparar várias métricas quando uma delas tem valores muito maiores do que as outras.
Na lista suspensa acima do painel direito, selecione Linha.
Clique na guia Métricas. Agora é possível adicionar métricas ao gráfico.
Para adicionar métricas de latência ao gráfico, siga estas etapas:
- Na caixa Localizar tipo de recurso e métrica, insira o valor
spanner.googleapis.com/api/request_latencies
e clique na linha exibida abaixo da caixa. - Na caixa Filtro, insira o valor
instance_id
e, em seguida, o ID da instância a ser examinada e clique em Aplicar. - Na lista suspensa Agregador, clique em máx.
Se preferir, altere o percentil de latência:
- Clique em Mostrar opções avançadas.
Clique na lista suspensa Alinhador e, em seguida, no percentil de latência que você quer visualizar.
Na maioria dos casos, você observa a latência do 50º percentil para entender a latência típica ou a latência do 99º percentil para entender a latência do 1% mais lento das solicitações.
Para adicionar métricas de utilização da CPU ao gráfico, siga estas etapas:
- Clique em Adicionar métrica.
- Na caixa Localizar tipo de recurso e métrica, insira o valor
spanner.googleapis.com/instance/cpu/utilization
e clique na linha exibida abaixo da caixa. - Na caixa Filtro, insira o valor
instance_id
e, em seguida, o ID da instância a ser examinada e clique em Aplicar. - Na lista suspensa Agregador, clique em máx.
Agora você tem um gráfico que mostra o uso da CPU e as métricas de latência para um instância do Spanner. Se as duas métricas forem maiores que o esperado ao mesmo tempo, será possível realizar etapas adicionais para corrigir o problema.
Para mais informações sobre como criar gráficos personalizados, consulte a documentação do Cloud Monitoring.
Criar alertas para métricas do Spanner
Ao criar uma instância do Spanner, você escolhe a capacidade de computação dela. Conforme a carga de trabalho da instância muda, O Spanner não ajusta automaticamente a capacidade de computação da instância. Como resultado, você precisa configurar diversos alertas para garantir que a instância permaneça dentro dos valores máximos recomendados para utilização da CPU e do limite de armazenamento recomendado.
Os exemplos a seguir mostram como configurar políticas de alertas para algumas métricas do Spanner. Para uma lista completa das métricas disponíveis, consulte lista de métricas do Spanner.
CPU de prioridade alta
Para criar uma política de alertas que é acionada quando o uso de CPU de alta prioridade para o Spanner está acima do limite recomendado, use as seguintes configurações.
Novo estado Campo |
Valor |
---|---|
Recurso e métrica | No menu Recursos, selecione Instância do Spanner. No menu Categorias de métrica, selecione Instância. No menu Métricas, selecione Utilização de CPU por prioridade. O metric.type é spanner.googleapis.com/instance/cpu/utilization_by_priority .
|
Filtrar | instance_id = YOUR_INSTANCE_ID priority = high
|
Séries cruzadas Série temporal agrupada por |
location para instâncias multirregionais. Deixe em branco para instâncias regionais. |
Várias séries Agregação de série temporal |
sum |
Janela contínua | 10 m |
Função de janela contínua | mean |
Campo Configurar gatilho de alerta |
Valor |
---|---|
Tipo de condição | Threshold |
Acionador de alerta | Any time series violates |
Posição do limite | Above threshold |
Valor do limite | 45% para instâncias multirregionais. 65% para instâncias regionais. |
Teste a janela novamente | 10 minutes |
CPU em média contínua de 24 horas
Para criar uma política de alertas que é acionada quando a média contínua de 24 horas de utilização da CPU para o Spanner está acima do limite recomendado, use as seguintes configurações:
Novo estado Campo |
Valor |
---|---|
Recurso e métrica | No menu Recursos, selecione Instância do Spanner. No menu Categorias de métrica, selecione Instância. No menu Métricas, selecione Utilização da CPU suavizada. O metric.type é spanner.googleapis.com/instance/cpu/smoothed_utilization .
|
Filtrar | instance_id = YOUR_INSTANCE_ID |
Várias séries Agregação de série temporal |
sum |
Janela contínua | 10 m |
Função de janela contínua | mean |
Campo Configurar gatilho de alerta |
Valor |
---|---|
Tipo de condição | Threshold |
Acionador de alerta | Any time series violates |
Posição do limite | Above threshold |
Limite | 90%
|
Teste a janela novamente | 10 minutes |
Armazenamento
Para criar uma política de alertas que é acionada quando o armazenamento da sua instância do Spanner está acima do limite recomendado, use as seguintes configurações:
Novo estado Campo |
Valor |
---|---|
Recurso e métrica | No menu Recursos, selecione Instância do Spanner. No menu Categorias de métrica, selecione Instância. No menu Métricas, selecione Armazenamento usado. O metric.type é spanner.googleapis.com/instance/storage/utilization .
|
Filtrar | instance_id = YOUR_INSTANCE_ID |
Várias séries Agregação de série temporal |
sum |
Janela contínua | 10 m |
Função de janela contínua | max |
Campo Configurar gatilho de alerta |
Valor |
---|---|
Tipo de condição | Threshold |
Condition triggers if | Any time series violates |
Posição do limite | Above threshold |
Valor do limite | Não é necessário definir um limite específico para o armazenamento máximo por nó. No entanto, recomendamos que você configure um alerta para quando estiver se aproximando do limite máximo de armazenamento. Para saber mais, consulte Métricas de utilização do armazenamento. |
Teste a janela novamente | 10 minutes |
A seguir
- Entenda as métricas de uso da CPU e latência do Spanner.
- Use o console do Google Cloud para ter uma visualização rápida dos as métricas mais importantes para a instância.
- Saiba mais sobre o Cloud Monitoring.