Esta documentação é referente à versão mais recente dos clusters do Anthos no Azure, lançada em 3 de novembro. Consulte as Notas de lançamento para mais informações.

Cloud Monitoring

Neste tópico, descrevemos como os clusters do Anthos no Azure se integram ao Cloud Monitoring e como visualizar suas métricas.

Antes de começar

  1. Configure a Google Cloud CLI e ative as APIs necessárias no projeto do Google Cloud.

  2. Autorize o Cloud Logging/Cloud Monitoring a configurar permissões para o pacote de operações do Google Cloud.

Visão geral

Os clusters do Anthos no Azure têm integração integrada com o Cloud Monitoring para métricas do sistema de nós, pods e contêineres. Isso permite ver facilmente o consumo de recursos das cargas de trabalho no cluster, criar painéis e configurar alertas.

Os clusters do Anthos no Azure instalam o coletor de métricas gke-metrics-agent no cluster. Esse agente é baseado no OpenTelemetry Collector e é executado em cada nó do cluster. Ele faz a amostragem das métricas a cada minuto e faz o upload das medições para o Cloud Monitoring.

Depois do upload das métricas para o cluster, elas residem no projeto do Google Cloud. É possível agregar dados em todos os seus clusters, criar painéis personalizados, explorar os dados de um único cluster, visualizar gráficos de linha, configurar alertas e muito mais.

Como usar o Metrics Explorer

Se quiser usar o Metrics Explorer para visualizar as métricas de um recurso monitorado, siga estas etapas:

  1. No Console do Google Cloud, acesse a página Metrics Explorer no Monitoring.
  2. Acessar o Metrics Explorer

  3. Selecione a guia Configuração.
  4. Expanda o menu Selecionar uma métrica, digite Kubernetes Container na barra de filtros e use os submenus para selecionar um tipo específico de recurso e métrica:
    1. No menu Recursos ativos, selecione Contêiner do Kubernetes.
    2. No menu Categorias de métrica ativas, selecione contêiner.
    3. No menu Métricas ativas, selecione Tempo de uso da CPU.
    4. Clique em Aplicar.
  5. Opcional: para configurar a visualização dos dados, adicione filtros e use os menus Agrupar por, Agregador e do tipo de gráfico. Por exemplo, é possível agrupar por rótulos de recurso ou métrica. Saiba mais em Selecionar métricas ao usar o Metrics Explorer.
  6. Opcional: altere as configurações do gráfico:
    • Para cotas e outras métricas que geram relatórios de uma amostra por dia, defina o período como pelo menos uma semana e o tipo de gráfico como Gráfico de barras empilhadas.
    • Para métricas de valor de distribuição, defina o tipo de gráfico como Gráfico de mapa de calor.

Quais métricas são coletadas

As métricas são coletadas usando um dos três tipos de recursos monitorados a seguir. Esses tipos correspondem a um objeto do Kubernetes em que a medição está sendo feita:

Por exemplo, as medidas sobre um pod usariam o tipo de recurso monitorado k8s_pod. Essas métricas incluiriam rótulos para pod_name e namespace_name, que identificam um pod específico.

Um conjunto diferente de tipos de métricas é usado para cada tipo de recurso monitorado. Para saber mais sobre esses tipos de métricas, consulte Métricas do sistema do GKE.

Por padrão, os clusters do Anthos no Azure coletam as seguintes métricas:

k8s_container

  • kubernetes.io/container/cpu/limit_utilization
  • kubernetes.io/container/cpu/request_utilization
  • kubernetes.io/container/cpu/core_usage_time
  • kubernetes.io/container/memory/limit_utilization
  • kubernetes.io/container/memory/used_bytes
  • kubernetes.io/container/restart_count
  • kubernetes.io/container/ephemeral_storage/limit_bytes
  • kubernetes.io/container/ephemeral_storage/request_bytes
  • kubernetes.io/container/ephemeral_storage/used_bytes
  • kubernetes.io/container/cpu/limit_cores
  • kubernetes.io/container/memory/limit_bytes
  • kubernetes.io/container/memory/request_bytes
  • kubernetes.io/container/memory/request_utilization
  • kubernetes.io/container/memory/page_fault_count
  • kubernetes.io/container/cpu/request_cores
  • kubernetes.io/container/uptime

k8s_node

  • kubernetes.io/node/cpu/allocatable_utilization
  • kubernetes.io/node/cpu/core_usage_time
  • kubernetes.io/node/memory/allocatable_utilization
  • kubernetes.io/node/memory/used_bytes
  • kubernetes.io/node/cpu/total_cores
  • kubernetes.io/node/cpu/allocatable_cores
  • kubernetes.io/node/ephemeral_storage/allocatable_bytes
  • kubernetes.io/node/memory/allocatable_bytes
  • kubernetes.io/node_daemon/cpu/core_usage_time
  • kubernetes.io/node/ephemeral_storage/used_bytes
  • kubernetes.io/node/ephemeral_storage/inodes_free
  • kubernetes.io/node_daemon/memory/used_bytes
  • kubernetes.io/node/pid_limit
  • kubernetes.io/node/pid_used
  • kubernetes.io/node/ephemeral_storage/total_bytes
  • kubernetes.io/node/ephemeral_storage/inodes_total
  • kubernetes.io/node/memory/total_bytes

k8s_pod

  • kubernetes.io/pod/network/received_bytes_count
  • kubernetes.io/pod/network/sent_bytes_count
  • kubernetes.io/pod/volume/total_bytes
  • kubernetes.io/pod/volume/used_bytes
  • kubernetes.io/pod/volume/utilization

A seguir