Configuración para políticas de alertas comunes

Si deseas crear una política de alertas, debes describir qué se supervisará, cuándo se activará la política y cómo deseas recibir la notificación. Esta página contiene la configuración que puedes usar para crear políticas de alertas. Cada sección de esta página tiene los siguientes elementos:

  • Título: Indica el nombre del producto relevante y una descripción breve de la política de alertas.
  • Resumen: Una descripción breve de la política de alertas. Para obtener más información, consulta la documentación del producto.
  • Pasos para crear una política de alertas: Descripción de los pasos necesarios para crear una política de alertas. Para obtener información detallada sobre estos pasos, consulta Crea una política de alertas.
  • Campos del panel de destino: Especifican qué se supervisa y cómo se agregan los datos. Si usas Google Cloud Console, estos son los campos del panel de Destino del cuadro de diálogo Agregar condición.
  • Campos de configuración: Especifican cuándo se activa la política de alertas. Si usas Google Cloud Console, estos son los campos que se muestran en el panel Configuración del cuadro de diálogo Agregar condición.

Puedes acceder a la configuración de la tabla del panel de destino cuando crees un gráfico o uses el Explorador de métricas.

Tiempo de ejecución de BigQuery

Para crear una política de alertas que se active cuando el percentil 50 del tiempo de ejecución de una consulta de BigQuery exceda un límite definido por el usuario, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type Global
Metric Query execution time
Filter
Aggregator none
Advanced Aggregation Aligner: 50th percentile
Alignment Period: 1 m
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Tú determinas el valor aceptable. Para esta métrica, considera un límite que sea de alrededor del doble del valor promedio para el percentil 50.
For 1 minute

Uso de BigQuery

Para crear una política de alertas que se active cuando las métricas de BigQuery transferidas superen un nivel definido por el usuario, sigue los pasos indicados a continuación:


Campo del panel Objetivo

Valor
Resource type Ingresa BigQuery Dataset.
Metric Las métricas específicas para el uso incluyen Stored bytes, Uploaded bytes y Uploaded bytes billed. Sin embargo, esta es solo en una lista parcial. Para obtener una lista completa de las métricas disponibles, consulta Métricas de BigQuery.
Filter project-id: Es el ID de tu proyecto de Google Cloud.
dataset_id: Es el ID de tu conjunto de datos.
Group By dataset_id: Es el ID de tu conjunto de datos.
Aggregator sum
Advanced Aggregation Aligner: mean
Alignment Period: 1 m
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Tú determinas el valor aceptable.
For 1 minute

Validación de inicio anticipado de Compute Engine

La Validación de inicio anticipado muestra el estado “aprobado” o “reprobado” de la parte de inicio anticipado de la última secuencia de inicio. El inicio anticipado es la secuencia de inicio que transcurre desde el arranque del firmware UEFI hasta que este le entrega el control al bootloader.

Para crear una política de alertas que se active cuando la secuencia de inicio anticipado falla en cualquiera de tus instancias de VM de Compute Engine, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type GCE VM Instance
Metric Early boot validation
Filter status = failed
Group By status
Aggregator sum
Advanced Aggregation Usa la configuración predeterminada.

Campo del panel Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Validación de inicio retardado de Compute Engine

La Validación de inicio retardado muestra el estado “aprobado” o “reprobado” de la parte de inicio retardado de la última secuencia de inicio. El inicio retardado es la secuencia de inicio que transcurre desde que el bootloader adquiere el control hasta el fin del proceso. Esto incluye la carga del kernel del sistema operativo.

Para crear una política de alertas que se active cuando la secuencia de inicio retardado falla en cualquiera de tus instancias de VM de Compute Engine, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type GCE VM Instance
Metric late boot validation
Filter status = failed
Group By status
Aggregator sum
Advanced Aggregation Usa la configuración predeterminada.

Campo del panel Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Registra los bytes mensuales de registros transferidos

Para crear una política de alertas que se active cuando los bytes de registros transferidos mensuales superen el límite que definió el usuario para Cloud Logging, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type Global
Metric Monthly log bytes ingested
Filter
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 60m
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Tú determinas el valor aceptable.
For El valor mínimo aceptable es 30 minutos.

Predicción de Recomendaciones IA

Para configurar una alerta de predicción de Recomendaciones IA, usa la siguiente configuración en la política de alertas:


Campo del panel Objetivo

Valor
Resource type Consumed API
Metric Request count
Filter service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.Predict
response_code != 200
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 5 minutes

Reducción del registro de eventos del usuario de Recomendaciones AI

Para configurar una alerta de reducción del registro de eventos de Recomendaciones IA, usa la siguiente configuración en la política de alertas:


Campo del panel Objetivo

Valor
Resource type Consumed API
Metric Request count
Filter service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.CollectUserEvent
response_code != 200
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is absent
Threshold
For 10 minutes

Uso de CPU de prioridad alta de Spanner

A fin de crear una política de alertas que se active cuando el uso de tu CPU de alta prioridad para Cloud Spanner supere un límite recomendado, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type* Cloud Spanner Instance
Metric CPU Utilization by priority
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Aggregator max
Advanced Aggregation Aligner: mean
Alignment Period: 10 m
*Seleccionar este tipo de recurso y métrica equivale a ingresar el siguiente valor en el panel Buscar tipo de recurso y métrica: spanner.googleapis.com/instance/cpu/utilization_by_priority.
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 45% en instancias de varias regiones;
65% en instancias regionales.
For 10 minutes

Uso continuo durante 24 horas de Spanner

A fin de crear una política de alertas que se active cuando el promedio móvil de 24 horas del uso de tu CPU para Cloud Spanner supere el límite recomendado, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type* Cloud Spanner Instance
Metric Smoothed CPU utilization
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Advanced Aggregation Aligner: mean
Alignment Period: 10 m
*Seleccionar este tipo de recurso y métrica equivale a ingresar el siguiente valor en el panel Buscar tipo de recurso y métrica: spanner.googleapis.com/instance/cpu/smoothed_utilization.
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 90%
For 10 minutes

Almacenamiento de Spanner

Para crear una política de alertas que se active cuando el almacenamiento de tu instancia de Cloud Spanner supere el límite recomendado, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type* Cloud Spanner Instance
Metric Storage used
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 10 m
*Seleccionar este tipo de recurso y métrica equivale a ingresar el siguiente valor en el panel Buscar tipo de recurso y métrica: spanner.googleapis.com/instance/storage/used_bytes.
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Establece el límite en un 75% del almacenamiento máximo por nodo, multiplicado por la cantidad de nodos. Para conocer los límites de nodos actuales, consulta Límites y cuotas de Cloud Spanner.

Cuando el límite es de 2 TB por nodo, el umbral recomendado es:

1649267441664 multiplicado por la cantidad de nodos de tu instancia.
For 10 minutes

Cuota superada de Trace en el uso de la API

Para crear una política de alertas que se active cuando tus intervalos transferidos mensuales de Cloud Trace superen tu cuota, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type Consumed API
Metric Request count
Filter service = cloudtrace.googleapis.com
response_code = 429
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Uso del intervalo mensual de supervisión de Trace

Para crear una política de alertas que se active cuando el número de intervalos transferidos en un mes de Cloud Trace supere el límite definido por el usuario, utiliza la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type global
Metric Monthly trace spans ingested
Filter
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 60m
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold Tú determinas el valor aceptable.
For El valor aceptable mínimo es 30 minutos.

Errores de exportación de seguimiento

Para crear una política de alertas que se active cuando haya errores mientras se exportan datos de Cloud Trace a BigQuery, usa la siguiente configuración:


Campo del panel Objetivo

Valor
Resource type Cloud Trace
Metric Spans Exported to BigQuery
Filter status != ok
Group by status
Aggregator sum
Advanced Aggregation Aligner: rate
Alignment Period: 1 m
Campo del panel
Condiciones

Valor
Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Supervisión de la verificación de tiempo de actividad

Si deseas crear una política de alertas para una verificación de tiempo de actividad o crear un gráfico en el que se muestre el estado de éxito o latencia de una verificación de tiempo de actividad, consulta Alertas sobre las verificaciones de tiempo de actividad.