Supervisa instancias con Cloud Monitoring

En este documento, se describe cómo usar la consola de Cloud Monitoring para supervisar tus instancias de Spanner.

La consola de Cloud Monitoring proporciona varias herramientas de supervisión para Spanner:

Si prefieres supervisar Spanner de manera programática, usa las bibliotecas cliente de Cloud para Cloud Monitoring a fin de recuperar las métricas.

Usa el panel seleccionado de Cloud Monitoring

Cloud Monitoring te proporciona un panel seleccionado que resume la información clave de tus instancias de Spanner, incluido lo siguiente:

  • Incidentes: alertas de supervisión creadas por el usuario que están abiertas, activas o resueltas
  • Eventos: Una lista de registros de auditoría de Spanner (si está habilitada y disponible)
  • Instancias: Un resumen de alto nivel de tus instancias de Spanner, que incluye la capacidad de procesamiento, el recuento de bases de datos y el estado de la instancia
  • Gráficos agregados de capacidad de procesamiento y uso de almacenamiento

Para ver el panel de Spanner, haz lo siguiente:

  1. En la consola de Google Cloud, selecciona Monitoring o usa el siguiente botón:

    Ir a Monitoring

  2. Si se muestra Recursos en el panel de navegación, selecciona Recursos y, luego, Cloud Spanner. De lo contrario, selecciona Paneles y, a continuación, el panel llamado Cloud Spanner.

Ver detalles de la instancia y la base de datos

Cuando abres el panel seleccionado de Spanner, se muestran los datos agregados de todas tus instancias. Para ver más detalles sobre una instancia específica, haz clic en el nombre de la instancia en Instancias.

El panel muestra información como metadatos de instancias, bases de datos en la instancia y gráficos de diversas métricas desglosados por región.

En la página del panel de la instancia, también puedes ver los gráficos de una base de datos específica en la instancia:

  1. En la parte derecha, sobre los gráficos de métricas de la instancia, haz clic en Métricas de la base de datos.

  2. En la lista desplegable Seleccionar un desglose, selecciona la base de datos que deseas examinar.

    La consola de Cloud Monitoring muestra gráficos de la base de datos.

Crea gráficos personalizados para las métricas de Spanner

Puedes usar Cloud Monitoring a fin de crear gráficos personalizados para las métricas de Spanner. Puedes usar el Explorador de métricas para crear gráficos temporales y ad hoc, o bien crear gráficos que aparecen en paneles personalizados.

En particular, Cloud Monitoring te permite crear un gráfico personalizado que muestra si dos o más métricas están correlacionadas entre sí. Por ejemplo, puedes verificar una correlación entre el uso de CPU y la latencia en una instancia de Spanner, lo que podría indicar que tu instancia necesita más capacidad de procesamiento o que algunas de tus consultas están generando un alto uso de CPU.

Para comenzar con este ejemplo, sigue estos pasos:

  1. En la consola de Google Cloud, selecciona Monitoring o usa el siguiente botón:

    Ir a Monitoring

  2. Si el Explorador de métricas aparece en el panel de navegación, selecciónalo. De lo contrario, selecciona Recursos y, luego, Explorador de métricas.

  3. Haz clic en la pestaña Ver opciones y, luego, selecciona la casilla de verificación Escala de registro en el eje Y. Esta opción te permite comparar varias métricas cuando una métrica tiene valores mucho más altos que las otras.

  4. En la lista desplegable que se encuentra arriba del panel derecho, selecciona Línea.

  5. Haz clic en la pestaña Métricas. Ahora puedes agregar métricas al gráfico.

Para agregar métricas de latencia al gráfico, sigue estos pasos:

  1. En el cuadro Buscar tipo de recurso y métrica, ingresa el valor spanner.googleapis.com/api/request_latencies y, luego, haz clic en la fila que aparece debajo del cuadro.
  2. En el cuadro Filtro, ingresa el valor instance_id, luego ingresa el ID de la instancia que deseas examinar y haz clic en Aplicar.
  3. En la lista desplegable Agregador, haz clic en máx.
  4. Opcional: cambia el percentil de latencia:

    1. Haz clic en Mostrar opciones avanzadas.
    2. Haz clic en la lista desplegable Alineador y, luego, en el percentil de latencia que deseas ver.

      En la mayoría de los casos, debes observar la latencia del percentil 50 para comprender la latencia típica o la latencia del percentil 99 a fin de comprender la latencia del 1% más lento de las solicitudes.

Para agregar métricas del uso de CPU al gráfico, sigue estos pasos:

  1. Haz clic en Agregar métrica.
  2. En el cuadro Buscar tipo de recurso y métrica, ingresa el valor spanner.googleapis.com/instance/cpu/utilization y, luego, haz clic en la fila que aparece debajo del cuadro.
  3. En el cuadro Filtro, ingresa el valor instance_id, luego ingresa el ID de la instancia que deseas examinar y haz clic en Aplicar.
  4. En la lista desplegable Agregador, haz clic en máx.

Ahora tienes un gráfico que muestra las métricas del uso de CPU y la latencia para una instancia de Spanner. Si ambas métricas son más altas de lo esperado al mismo tiempo, puedes realizar pasos adicionales para corregir el problema.

Para obtener más información sobre cómo crear gráficos personalizados, consulta la documentación de Cloud Monitoring.

Crear alertas para las métricas de Spanner

Cuando creas una instancia de Spanner, debes elegir la capacidad de procesamiento de la instancia. A medida que cambia la carga de trabajo de la instancia, Spanner no ajusta de forma automática la capacidad de procesamiento de la instancia. Como resultado, debes configurar varias alertas para asegurarte de que la instancia se mantenga dentro de los máximos recomendados para el uso de CPU y el límite recomendado de almacenamiento.

En los siguientes ejemplos, se muestra cómo configurar políticas de alertas para algunas métricas de Spanner. Para obtener una lista completa de las métricas disponibles, consulta la lista de métricas de Spanner.

CPU de alta prioridad

Para crear una política de alertas que se active cuando el uso de tu CPU de alta prioridad para Spanner supere un umbral recomendado, usa la siguiente configuración.

Nueva condición
Campo

Valor
Recurso y métrica En el menú Recursos, selecciona Instancia de Spanner.
En el menú Categorías de métricas, selecciona Instancia.
En el menú Métricas, selecciona Uso de CPU por prioridad.

(El metric.type es spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
Series temporales
Grupo de series temporales por
location para instancias multirregionales;
déjalo en blanco para instancias regionales.
Series temporales
Agregación de series temporales
sum
Ventana progresiva 10 m
Función analítica progresiva mean
Configura el activador de alertas
Campo

Valor
Tipo de condición Threshold
Activador de alertas Any time series violates
Posición del umbral Above threshold
Valor del umbral 45% para instancias multirregionales;
65% para instancias regionales.
Período para volver a probar 10 minutes

CPU promedio móvil de 24 horas

Para crear una política de alertas que se active cuando el promedio móvil de 24 horas del uso de tu CPU para Spanner supere el umbral recomendado, usa la siguiente configuración.

Nueva condición
Campo

Valor
Recurso y métrica En el menú Recursos, selecciona Instancia de Spanner.
En el menú Categorías de métricas, selecciona Instancia.
En el menú Métricas, selecciona Uso de CPU suavizado.

(El metric.type es spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Series temporales
Agregación de series temporales
sum
Ventana progresiva 10 m
Función analítica progresiva mean
Configura el activador de alertas
Campo

Valor
Tipo de condición Threshold
Activador de alertas Any time series violates
Posición del umbral Above threshold
Umbral 90%
Período para volver a probar 10 minutes

Almacenamiento

Para crear una política de alertas que se active cuando el almacenamiento de tu instancia de Spanner supere un umbral recomendado, usa la siguiente configuración.

Nueva condición
Campo

Valor
Recurso y métrica En el menú Recursos, selecciona Instancia de Spanner.
En el menú Categorías de métricas, selecciona Instancia.
En el menú Métricas, selecciona Almacenamiento utilizado.

(El metric.type es spanner.googleapis.com/instance/storage/utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Series temporales
Agregación de series temporales
sum
Ventana progresiva 10 m
Función analítica progresiva max
Configura el activador de alertas
Campo

Valor
Tipo de condición Threshold
Activadores de condición si: Any time series violates
Posición del umbral Above threshold
Valor del umbral No es necesario que establezcas un umbral específico para el almacenamiento máximo por nodo. Sin embargo, te recomendamos que configures una alerta que se active cuando te acerques al límite máximo de almacenamiento. Para obtener más información, consulta Métricas de uso de almacenamiento.
Período para volver a probar 10 minutes

¿Qué sigue?