Supervisa el Sincronizador de configuración con Cloud Monitoring

En la página, se describe cómo enviar métricas del Sincronizador de configuración a Cloud Monitoring.

El Sincronizador de configuración usa OpenTelemetry para crear, registrar y exportar sus métricas. En esta página, se explica cómo configurar las métricas de Cloud Monitoring. Para conocer otras formas de exportar métricas, consulta Supervisa el Sincronizador de configuración con Prometheus o Supervisa el Sincronizador de configuración con la supervisión personalizada.

Para configurar las métricas de Cloud Monitoring, se requiere el permiso iam.serviceAccounts.setIamPolicy en el proyecto. Para obtener ejemplos sobre cómo ver estas métricas, consulta Ejemplos de procedimientos de depuración. Puedes ver estas métricas con el Explorador de métricas o usando la API de Cloud Monitoring.

Otorga permiso de escritura de métricas para Cloud Monitoring

Para configurar Cloud Monitoring para el Sincronizador de configuración, debes otorgar permiso de escritura de métricas a una cuenta de servicio en tu proyecto. El permiso necesario depende de si Workload Identity Federation for GKE está habilitada.

Configura Cloud Monitoring con Workload Identity Federation for GKE

Si la Workload Identity Federation for GKE está habilitada, ejecuta este comando para permitir que el Sincronizador de configuración envíe métricas:

gcloud projects add-iam-policy-binding PROJECT_ID \
   --role=roles/monitoring.metricWriter \
   --member="serviceAccount:PROJECT_ID.svc.id.goog[config-management-monitoring/default]"

Reemplaza PROJECT_ID por el ID del proyecto del clúster.

Configura Cloud Monitoring sin Workload Identity Federation for GKE

Si Workload Identity Federation for GKE no está habilitada y el Sincronizador de configuración se ejecuta dentro de un entorno de Google Cloud, puedes usar la cuenta de servicio predeterminada de Compute Engine. Si las asignaciones automáticas del rol de editor (roles/editor) están inhabilitadas, ejecuta el siguiente comando para otorgarle a la cuenta de servicio el rol de IAM de escritor de métricas de Monitoring (roles/monitoring.metricWriter):

gcloud projects add-iam-policy-binding PROJECT_ID \
   --role=roles/monitoring.metricWriter \
   --member=serviceAccount:PROJECT_NUMBER-compute@developer.gserviceaccount.com

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID de tu proyecto.
  • PROJECT_NUMBER: Es el número de tu proyecto.

Lista predeterminada de métricas en Cloud Monitoring

Nombre Tipo
api_duration_seconds Distribución
apply_duration_seconds Distribución
apply_operations_total Recuento
declared_resources Último valor
internal_errors_total Recuento
last_sync_timestamp Último valor
pipeline_error_observed Último valor
reconciler_errors Último valor
resource_fights_total Recuento
reconcile_duration_seconds Distribución
resource_group_total Último valor
resource_count Último valor
ready_resource_count Último valor
resource_ns_count Último valor
cluster_scoped_resource_count Último valor
kcc_resource_count Indicador

Para modificar la lista de entidades permitidas de las métricas en Cloud Monitoring, sigue las instrucciones para aplicar un parche a la implementación del recopilador de Otel con ConfigMap.

Procedimientos de depuración de ejemplo para Cloud Monitoring

En los siguientes ejemplos de Cloud Monitoring, se ilustran algunos patrones para usar métricas de OpenCensus a fin de detectar y diagnosticar problemas relacionados con el Sincronizador de configuración cuando usas las API de RootSync y RepoSync.

Formato de métrica

En Cloud Monitoring, las métricas tienen el siguiente formato: custom.googleapis.com/opencensus/config_sync/METRIC.

Este nombre de métrica tiene los siguientes componentes:

  • custom.googleapis.com: todas las métricas personalizadas tienen este prefijo
  • opencensus: este prefijo se agrega porque el Sincronizador de configuración usa la biblioteca de OpenCensus
  • config_sync/: las métricas que el Sincronizador de configuración exporta a Cloud Monitoring tienen este prefijo
  • METRIC: el nombre de la métrica que deseas consultar

Consulta métricas por conciliador

Los objetos RootSync y RepoSync están equipados con métricas de alto nivel que te brindan estadísticas útiles sobre cómo funciona el Sincronizador de configuración en el clúster. Casi todas las métricas están etiquetadas por el nombre del conciliador. Por lo tanto, puedes ver si se produjeron errores y configurar alertas para ellas en Cloud Monitoring.

Un conciliador es un Pod que se implementa como una implementación. Sincroniza los manifiestos de una fuente de información a un clúster. Cuando creas un objeto RootSync, el Sincronizador de configuración crea un conciliador llamado root-reconciler-ROOT_SYNC_NAME o root-reconciler si el nombre de RootSync es root-sync. Cuando creas un objeto RepoSync, el Sincronizador de configuración crea un conciliador llamado ns-reconciler-NAMESPACE-REPO_SYNC_NAME-REPO_SYNC_NAME_LENGTH o ns-reconciler-NAMESPACE si el nombre de RepoSync es repo-sync, en el que NAMESPACE es el espacio de nombres en el que creaste tu objeto RepoSync.

En el siguiente diagrama, se muestra cómo funcionan los Pods de conciliación cuando la fuente de información es un repositorio de Git:

Flujo de conciliación

Por ejemplo, para filtrar por nombre de conciliador cuando usas Cloud Monitoring, completa las siguientes tareas:

  1. En la consola de Google Cloud, ve a Monitoring.

    Ir a Monitoring

  2. En el panel de navegación de Monitoring, haz clic en el explorador de métricas del Explorador de métricas.

  3. En la lista desplegable Seleccionar una métrica, agrega custom.googleapis.com/opencensus/config_sync/reconciler_errors.

  4. En la lista desplegable Filtro, selecciona reconcilier. Aparecerá un cuadro de campos de filtro.

  5. En el cuadro de campos de filtro, selecciona = en el primer campo y el nombre del agente de conciliación (por ejemplo, root-reconciler) en el segundo.

  6. Haz clic en Aplicar.

Ahora podrás ver las métricas de tus objetos RootSync.

Para obtener más instrucciones sobre cómo realizar un filtro por un tipo de datos específico, consulta Filtra los datos.

Consulta las operaciones del Sincronizador de configuración por componente y estado

Cuando habilitas las APIs de RootSync y RepoSync, los conciliadores se encargan de importar y aprovisionar desde una fuente de información y sincronizar con un clúster. La métrica reconciler_errors está etiquetada por componente para que puedas ver dónde se produjeron los errores.

Por ejemplo, para filtrar por componente cuando usas Cloud Monitoring, completa las siguientes tareas:

  1. En la consola de Google Cloud, ve a Monitoring.

    Ir a Monitoring

  2. En el panel de navegación de Monitoring, haz clic en el explorador de métricas del Explorador de métricas.

  3. En la lista desplegable Seleccionar una métrica, agrega custom.googleapis.com/opencensus/config_sync/reconciler_errors.

  4. En la lista desplegable Filtro, selecciona componente. Aparecerá un cuadro de campos de filtro.

  5. En el cuadro de campos de filtro, selecciona = en el primer cuadro y source en el segundo.

  6. Haz clic en Aplicar.

Ahora puedes ver los errores que se produjeron cuando se originaron en una fuente de información para tus conciliaciones.

También puedes verificar las métricas de los procesos de origen y sincronización consultando las siguientes métricas y filtrándolas por la etiqueta status:

custom.googleapis.com/opencensus/config_sync/parser_duration_seconds
custom.googleapis.com/opencensus/config_sync/apply_duration_seconds
custom.googleapis.com/opencensus/config_sync/remediate_duration_seconds