Observar clústeres

En esta página, se explica cómo usar las opciones de registro y supervisión disponibles con el modo privado de Anthos.

Esta página está destinada a los administradores de la plataforma.

Supervisa paneles

Los paneles de muestra para la supervisión de métricas de clústeres y nodos están disponibles en el centro de administración de Anthos.

Pestaña Monitoring

El botón Panel de supervisión de Grafana abre la aplicación de Grafana alojada en el clúster de administrador. El acceso a Grafana se controla a través del Centro de administración. Si accediste al centro de administración, no se requiere acceso adicional.

Después de acceder, encontrará una lista de paneles de muestra disponibles para la demostración:

Paneles de Grafana

Registros de consultas

El botón Registros Loki de Grafana abre el explorador de Grafana, en la que se pueden consultar los registros, incluidos los registros del sistema de Kubernetes. Los registros se etiquetan como se describe en la siguiente sección.

Etiquetas de registro

Tipo de registro Etiquetas
Registros de contenedores
  • cluster=CLUSTER_NAME
  • resources=k8s_container
  • namespace=NAMESPACE_NAME
  • node=NODE_NAME
  • pod=POD_NAME
  • container=CONTAINER_NAME
  • Otras etiquetas de Kubernetes
Registros del nodo de journald
  • cluster=CLUSTER_NAME
  • resources=k8s_node
  • node=NODE_NAME
  • identifier=SYSLOG_IDENTIFIER
  • machine=MACHINE_ID
Registros de auditoría
  • cluster=CLUSTER_NAME
  • resource=k8s_audit
  • level=LEVEL
  • vert=VERB

Todas las etiquetas de Kubernetes y una etiqueta del clúster se incluyen como etiquetas de registro.

Consultas de muestra

  • En la siguiente consulta, se seleccionan los registros de contenedores:

    {cluster="admin", namespace="kube-system", resources="k8s_container", container="kube-apiserver"}
    
  • En la siguiente consulta, se seleccionan los registros de operadores de clúster:

    {cluster="admin", namespace="kube-system", resources="k8s_container", control_plane="anthos-cluster-operator"}
    

    El operador de clúster es un recurso que proporciona Anthos en equipos físicos que administra los clústeres de usuario y los recursos relacionados en el clúster de administrador.

  • En la siguiente consulta, se seleccionan los registros de nodos de journald:

    {cluster="admin", resources="k8s_node"}
    
  • En la siguiente consulta, se seleccionan los registros de auditoría:

    {cluster="admin", resources="k8s_audit"}
    
  • En la siguiente consulta, se seleccionan los registros de arranque del clúster de usuario:

    {cluster="admin", namespace="cluster-user-1"}
    

    El clúster de usuario que se inicia es “user-1”.

Registros del centro de administración

  • La siguiente consulta selecciona los registros de acm-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="acm-controller-manager"}
    
  • La siguiente consulta selecciona los registros de acm-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="asm-controller-manager"}
    
  • La siguiente consulta selecciona los registros de bootstrap-service-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="bootstrap-service-controller-manager"}
    
  • La siguiente consulta selecciona los registros de billing-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="billing-controller-manager"}
    
  • La siguiente consulta selecciona los registros de anthos-admin-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="anthos-admin-controller-manager"}
    
  • La siguiente consulta selecciona los registros de iam-controller-manager:

    {cluster="admin", namespace="anthos-management-center", resources="k8s_container", control_plane="iam-controller-manager"}
    

Configura una StorageClass personalizada

El modo privado de Anthos usa PersistentVolumeClaims a fin de aprovisionar espacio para almacenar métricas, registros, paneles y alertas. Cuando creas un clúster, este crea de forma automática un recurso personalizado de LogMon. Para anular el StorageClass predeterminado, completa los siguientes pasos:

  1. Ejecuta el siguiente comando para abrir tu recurso personalizado de LogMon en un editor de línea de comandos:

    kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
    
  2. En el recurso personalizado de LogMon, actualiza el storageClassName en el campo spec:

    apiVersion: addons.gke.io/v1alpha1
    kind: Logmon
    metadata:
      # Don't change the name
      name: logmon-default
      # Don't change the namespace
      namespace: kube-system
    spec:
      system_logs:
        outputs:
          default_loki:
            deployment:
              storageClassName: anthos-system # configure the new storage class here 
      system_metrics:
        outputs:
          default_prometheus:
            deployment:
              storageClassName: anthos-system # configure the new storage class here
    
  3. Para guardar los cambios en el recurso personalizado de LogMon, guarda el editor de línea de comandos y sal de él.

Configura el tamaño de almacenamiento

Cuando creas un clúster, este crea de forma automática un recurso personalizado de LogMon. Para anular el tamaño de almacenamiento de las métricas, los registros, los paneles y las alertas, completa los siguientes pasos:

  1. Ejecuta el siguiente comando para abrir tu recurso personalizado de LogMon en un editor de línea de comandos:

    kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
    
  2. En el recurso personalizado de LogMon, actualiza el storageSize en el campo spec:

    apiVersion: addons.gke.io/v1alpha1
    kind: Logmon
    metadata:
      # Don't change the name
      name: logmon-default
      # Don't change the namespace
      namespace: kube-system
    spec:
      system_logs:
        outputs:
          default_loki:
            deployment:
              components:
                loki:
                   storageSize: 20Gi # configure the new storage size for logs here
      system_metrics:
        outputs:
          default_prometheus:
            deployment:
              components:
                alertmanager:
                   storageSize: 1Gi # configure the new storage size for alerts here
                grafana:
                   storageSize: 1Gi # configure the new storage size for dashboards here
                prometheus:
                   storageSize: 20Gi # configure the new storage size for metrics here
    ````
    
  3. Para guardar los cambios en el recurso personalizado de LogMon, guarda el editor de línea de comandos y sal de él.

Configura el tiempo de retención

Para configurar el tiempo de retención de los registros de los agentes de Prometheus y Loki que se ejecutan en el clúster, completa los siguientes pasos:

  1. Ejecuta el siguiente comando para abrir tu recurso personalizado de LogMon en un editor de línea de comandos:

    kubectl --kubeconfig=ADMIN_OIDC_KUBECONFIG -n kube-system edit logmon logmon-default
    
  2. En el recurso personalizado de LogMon, actualiza el retentionTime en el campo spec:

    apiVersion: addons.gke.io/v1alpha1
    kind: Logmon
    metadata:
      # Don't change the name
      name: logmon-default
      # Don't change the namespace
      namespace: kube-system
    spec:
      system_logs:
        outputs:
          default_loki:
            deployment:
              retentionPolicy:
                retentionTime: 720h # configure the new retention time for logs here
      system_metrics:
        outputs:
          default_prometheus:
            deployment:
              retentionPolicy:
                retentionTime: 720h # configure the new retention time for metrics here
    
  3. Para guardar los cambios en el recurso personalizado de LogMon, guarda el editor de línea de comandos y sal de él.

¿Qué sigue?