En esta página se describe cómo acceder a los paneles de estado para monitorizar e identificar posibles problemas.
El estado de salud te ayuda a visualizar las métricas esenciales de tu infraestructura de dispositivo aislada de Google Distributed Cloud (GDC) y te ofrece una vista general del estado de los componentes. Visualizar los paneles de control de estado de salud te ayuda a identificar las causas principales, diagnosticar comportamientos y obtener contexto adicional durante la investigación para resolver problemas.
GDC monitoriza y proporciona el estado de salud de cada componente de hardware y software, incluidos los siguientes:
- Hardware: nodo de servidor
- Software: clústeres, máquinas virtuales y almacenamiento
Los paneles de control de estado de salud te permiten visualizar las métricas con las que cada componente mide el estado de la monitorización.
Antes de empezar
Los clústeres raíz contienen una instancia de Grafana para los operadores de infraestructura. Estas instancias de Grafana contienen los paneles de estado.
Necesitas controles de acceso basados en roles para acceder a las visualizaciones de datos de forma segura en los paneles de control de la instancia de Grafana. Por este motivo, sigue las instrucciones de la sección Antes de empezar a consultar métricas en los paneles de control para acceder a los paneles de control de las instancias de Grafana.
Endpoint de Grafana
Abre una de las siguientes URLs para acceder al endpoint de Grafana del proyecto infra-obs
o del clúster de administrador raíz:
Endpoint de Grafana del proyecto
infra-obs
:https://GDC_URL/infra-obs/grafana
Sustituye GDC_URL por la URL de una organización de GDC.
Endpoint de Grafana del clúster de administrador raíz:
https://ROOT_ADMIN_CLUSTER_URL/grafana
Sustituye ROOT_ADMIN_CLUSTER_URL por la URL del clúster de administrador raíz en GDC.
Ejemplos de uso
En esta sección se incluyen ejemplos de cómo puedes usar el panel de control en casos prácticos.
Ajuste de rendimiento
Si un componente no funciona correctamente, pero no afecta necesariamente al SLO ni activa alertas, puedes comunicárselo de forma proactiva a los desarrolladores y evitar que se produzcan problemas en el futuro.
Del mismo modo, un componente puede querer saber cómo funciona su función para tomar las decisiones de rendimiento adecuadas. Los estados de salud son un mecanismo para recoger la información que necesitan los componentes.
Desarrollo de funciones
Supongamos que un cliente solicita cambios o que GDC tiene previsto lanzar una nueva función. En ese caso, puedes observar el estado de salud de los componentes pertinentes para determinar si es viable admitir la nueva función o el cambio. Además, el estado de salud se puede usar para tomar decisiones sobre el producto a la hora de priorizar el trabajo.
Por ejemplo, supongamos que un componente tiene una latencia media de 500 ms y quiere reducirla a 250 ms. En ese caso, el equipo puede calcular el coste relativo de una reducción incremental del 50% y compararlo con el diseño de un endpoint con un tiempo de respuesta de 250 ms.