Observar clusters

Nesta página, explicamos como usar as opções de geração de registros e monitoramento disponíveis com o Anthos em execução no modo desconectado.

Esta página é destinada a administradores da plataforma.

Monitorar painéis

Painéis de amostra para clusters e monitoramento de métricas de nós estão disponíveis no Centro de gerenciamento do Anthos.

Guia "Monitoramento".

O botão do Painel de monitoramento do Grafana abre o aplicativo Grafana, hospedado no cluster do administrador. O acesso ao Grafana é controlado com o Management Center. Se você estiver conectado à Central de gerenciamento, nenhum outro login será necessário.

Depois de fazer login, uma lista de painéis de amostra fica disponível para demonstração:

Painéis do Grafana

Registros da consulta

O botão Registros do Grafana Loki abre o Explorador do Grafana, onde registros, incluindo os registros do sistema do Kubernetes, podem ser consultados. Os registros são rotulados conforme descrito na seção a seguir.

Rótulos de registro

Tipo de registro Rótulos
Registros do contêiner
  • cluster=CLUSTER_NAME
  • resources=k8s_container
  • namespace=NAMESPACE_NAME
  • node=NODE_NAME
  • pod=POD_NAME
  • container=CONTAINER_NAME
  • Outros rótulos do Kubernetes
Registros de nó do journald
  • cluster=CLUSTER_NAME
  • resources=k8s_node
  • node=NODE_NAME
  • identifier=SYSLOG_IDENTIFIER
  • machine=MACHINE_ID
Registros de auditoria
  • cluster=CLUSTER_NAME
  • resource=k8s_audit
  • level=LEVEL
  • vert=VERB

Todos os rótulos do Kubernetes e um rótulo de cluster são incluídos como rótulos de registro.

Amostras de consultas

  • A consulta a seguir seleciona registros de contêiner:

    {cluster="admin", namespace="kube-system", resources="k8s_container", container="kube-apiserver"}
    
  • A consulta a seguir seleciona registros de operador do cluster:

    {cluster="admin", namespace="kube-system", resources="k8s_container", control_plane="anthos-cluster-operator"}
    

    O operador de cluster é um recurso fornecido pelo Anthos em Bare Metal que gerencia clusters de usuários e recursos relacionados no cluster de administrador.

  • A consulta a seguir seleciona registros de diário do nó:

    {cluster="admin", resources="k8s_node"}
    
  • A consulta a seguir seleciona registros de auditoria:

    {cluster="admin", resources="k8s_audit"}
    
  • A consulta a seguir seleciona registros de inicialização do cluster de usuário:

    {cluster="admin", namespace="cluster-user-1"}
    

    Em que o cluster de usuário que está sendo inicializado é "user-1".

Registros do Centro de gerenciamento

  • A consulta a seguir seleciona os registros acm-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="acm-controller-manager"}
    
  • A seguinte consulta seleciona os registros asm-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="asm-controller-manager"}
    
  • A seguinte consulta seleciona os registros bootstrap-service-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="bootstrap-service-controller-manager"}
    
  • A seguinte consulta seleciona os registros billing-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="billing-controller-manager"}
    
  • A consulta a seguir seleciona os registros anthos-admin-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="anthos-admin-controller-manager"}
    
  • A consulta a seguir seleciona registros iam-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="iam-controller-manager"}
    

Configurar um StorageClass personalizado

O Anthos em execução no modo desconectado usa PersistentVolumeClaims para provisionar espaço para armazenar métricas, registros, painéis e alertas. Quando você cria um cluster, ele cria automaticamente um recurso LogMon personalizado. Para substituir o StorageClass padrão, siga estas etapas:

  1. Execute o comando a seguir para abrir o recurso personalizado LogMon em um editor de linha de comando:

    kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
    
  2. No recurso personalizado LogMon, atualize storageClassName no campo spec:

    apiVersion: addons.gke.io/v1alpha1
    kind: Logmon
    metadata:
      # Don't change the name
      name: logmon-default
      # Don't change the namespace
      namespace: kube-system
    spec:
      system_logs:
        outputs:
          default_loki:
            deployment:
              storageClassName: anthos-system # configure the new storage class here 
      system_metrics:
        outputs:
          default_prometheus:
            deployment:
              storageClassName: anthos-system # configure the new storage class here
    
  3. Para salvar as alterações no recurso personalizado LogMon, salve e saia do editor de linha de comando.

Configurar o tamanho do armazenamento

Quando você cria um cluster, ele cria automaticamente um recurso LogMon personalizado. Para modificar o tamanho do armazenamento para métricas, registros, painéis e alertas, siga estas etapas:

  1. Execute o comando a seguir para abrir o recurso personalizado LogMon em um editor de linha de comando:

    kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
    
  2. No recurso personalizado LogMon, atualize storageSize no campo spec:

    apiVersion: addons.gke.io/v1alpha1
    kind: Logmon
    metadata:
      # Don't change the name
      name: logmon-default
      # Don't change the namespace
      namespace: kube-system
    spec:
      system_logs:
        outputs:
          default_loki:
            deployment:
              components:
                loki:
                   storageSize: 20Gi # configure the new storage size for logs here
      system_metrics:
        outputs:
          default_prometheus:
            deployment:
              components:
                alertmanager:
                   storageSize: 1Gi # configure the new storage size for alerts here
                grafana:
                   storageSize: 1Gi # configure the new storage size for dashboards here
                prometheus:
                   storageSize: 20Gi # configure the new storage size for metrics here
    ````
    
  3. Para salvar as alterações no recurso personalizado LogMon, salve e saia do editor de linha de comando.

Configurar o tempo de retenção

Para configurar o tempo de retenção para registros nos agentes do Prometheus e do Loki, em execução no cluster, siga estas etapas:

  1. Execute o comando a seguir para abrir o recurso personalizado LogMon em um editor de linha de comando:

    kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
    
  2. No recurso personalizado LogMon, atualize retentionTime no campo spec:

    apiVersion: addons.gke.io/v1alpha1
    kind: Logmon
    metadata:
      # Don't change the name
      name: logmon-default
      # Don't change the namespace
      namespace: kube-system
    spec:
      system_logs:
        outputs:
          default_loki:
            deployment:
              retentionPolicy:
                retentionTime: 720h # configure the new retention time for logs here
      system_metrics:
        outputs:
          default_prometheus:
            deployment:
              retentionPolicy:
                retentionTime: 720h # configure the new retention time for metrics here
    
  3. Para salvar as alterações no recurso personalizado LogMon, salve e saia do editor de linha de comando.

A seguir