Supervisar el estado

En esta página, se describe cómo acceder a los paneles de estado para supervisar e identificar posibles problemas.

El estado de salud te ayuda a visualizar las métricas esenciales de la infraestructura del dispositivo aislado de Google Distributed Cloud (GDC) y proporciona una descripción general de alto nivel del estado de los componentes. Visualizar los paneles de estado te ayuda a identificar las causas raíz, diagnosticar comportamientos y obtener contexto adicional durante la investigación para resolver problemas.

El GDC supervisa y proporciona el estado de cada componente de hardware y software, lo que incluye lo siguiente:

  • Hardware: nodo del servidor
  • Software: clústeres, VMs y almacenamiento

Los paneles de estado te permiten visualizar las métricas con las que cada componente mide el estado de supervisión.

Antes de comenzar

Los clústeres raíz contienen una instancia de Grafana para los operadores de infraestructura. Estas instancias de Grafana contienen los paneles de estado de la instancia.

Necesitas controles de acceso basados en roles para acceder a las visualizaciones de datos de forma segura en los paneles de la instancia de Grafana. Por este motivo, sigue las instrucciones de la sección Antes de comenzar para consultar y ver las métricas en los paneles y acceder a los paneles en las instancias de Grafana.

Extremo de Grafana

Abre una de las siguientes URLs para acceder al extremo de Grafana del proyecto infra-obs o del clúster de administrador raíz:

  • Extremo de Grafana del proyecto infra-obs:

    https://GDC_URL/infra-obs/grafana
    

    Reemplaza GDC_URL por la URL de una organización en GDC.

  • Extremo de Grafana del clúster de administrador raíz:

    https://ROOT_ADMIN_CLUSTER_URL/grafana
    

    Reemplaza ROOT_ADMIN_CLUSTER_URL por la URL del clúster de administrador raíz en GDC.

Ejemplos de casos de uso

En esta sección, se incluyen ejemplos de cómo puedes usar el panel en casos prácticos.

Ajustes de rendimiento

Si un componente tiene un rendimiento bajo, pero no necesariamente afecta el SLO ni activa alertas, puedes comunicarte de forma proactiva con los desarrolladores y evitar que se produzcan problemas en el futuro.

Del mismo modo, un componente podría querer saber cómo funciona su función para tomar las decisiones correctas sobre el rendimiento. Los estados de salud son un mecanismo para recopilar la información que necesitan los componentes.

Desarrollo de funciones

Supongamos que un cliente solicita cambios o que GDC planea lanzar una nueva función. En ese caso, puedes observar el estado de los componentes pertinentes para determinar la viabilidad de admitir la nueva función o el cambio. Además, el estado de salud se puede usar para tomar decisiones sobre el producto cuando se prioriza el trabajo.

Por ejemplo, supongamos que un componente tiene una latencia promedio de 500 ms y le interesa reducirla a 250 ms. En ese caso, el equipo puede calcular el costo relativo de una reducción incremental del 50% y compararlo con el diseño de un extremo con un tiempo de respuesta de 250 ms.