Acerca de la detección de anomalías

Esta página se aplica a Apigee y Apigee Hybrid.

Consulta la documentación de Apigee Edge.

¿Qué es una anomalía?

Un anomalía es un patrón de datos de API inusual o inesperado. Por ejemplo, observa el grafo de la tasa de errores de la API a continuación:

Grafo de una anomalía de tasa de error

Como puedes ver, la tasa de error aumenta repentinamente cerca de las 7 a.m. En comparación con los datos anteriores, este aumento es lo suficientemente inusual como para clasificarlo como una anomalía.

Sin embargo, no todas las variantes de los datos de la API representan anomalías: la mayoría son fluctuaciones aleatorias. Por ejemplo, puedes ver algunas variaciones relativamente pequeñas en la tasa de error que conducen a la anomalía, pero no son lo suficientemente significativas como para llamar a una anomalía verdadera.

Anomalía en comparación con una variación de datos aleatorios.

AAPI Ops supervisa los datos de la API de forma continua y realiza análisis estadísticos para distinguir anomalías reales de fluctuaciones aleatorias en los datos.

Sin la detección de anomalías, debes elegir un umbral para detectar cada anomalía. (Un umbral es un valor que una cantidad, como la tasa de error, debe alcanzar para activar una anomalía). También debes mantener actualizados los valores del umbral en función de los datos más recientes. Por el contrario, AAPI-Ops elige el mejor umbral de anomalía, según los patrones de datos recientes.

Cuando la API detecta una anomalía como la que se muestra arriba, muestra los detalles de la anomalía en el panel de eventos de anomalías. A partir de ahora, puedes investigar la anomalía en los paneles de Supervisión de API y tomar las medidas adecuadas si es necesario. También puedes crear una alerta que te notifique si ocurren eventos similares en el futuro.

En una anomalía detectada, se incluye la siguiente información:

  • La métrica que causó la anomalía, como la latencia del proxy o un código de error HTTP
  • La gravedad de la anomalía. La gravedad puede ser leve, moderada o grave, según su nivel de confianza en el modelo. Un nivel de confianza bajo indica que la gravedad es leve, mientras que un nivel de confianza alto indica que es grave.

Tipos de anomalías

Apigee detecta de forma automática los siguientes tipos de anomalías:

  • Aumento de errores HTTP 503 a nivel de organización, entorno y región
  • Aumento de errores HTTP 504 a nivel de organización, entorno y región
  • Aumento de todos los errores HTTP 4xx o 5xx a nivel de organización, entorno y región
  • Aumento en la latencia total de respuesta para el percentil 90 (p90) a nivel de organización, entorno y región

Cómo funciona la detección de anomalías

La detección de anomalías implica las siguientes etapas:

Entrena modelos

La detección de anomalías funciona mediante el entrenamiento de un modelo de comportamiento de tus proxies de API a partir de datos históricos de series temporales. No es necesario que realices ninguna acción para entrenar el modelo. Apigee crea y entrena de forma automática modelos de las seis horas anteriores de los datos de API. Por lo tanto, Apigee requiere un mínimo de seis horas de datos en un proxy de API a fin de entrenar el modelo antes de que pueda registrar una anomalía.

El objetivo del entrenamiento es mejorar la exactitud del modelo, que, luego, se puede probar con datos históricos. La forma más simple de probar la exactitud de un modelo es calcular su tasa de error, la suma de falsos positivos y falsos negativos, dividida por la cantidad total de eventos previstos.

Registra eventos de anomalía

En el entorno de ejecución, la detección de anomalías en Apigee compara el comportamiento actual de los proxies de API con el comportamiento que predice el modelo. La detección de anomalías puede determinar, con un nivel de confianza específico, cuando una métrica operativa excede el valor previsto. Por ejemplo, cuando la tasa de errores 5xx supera la tasa que predice el modelo.

Cuando Apigee detecta una anomalía, registra automáticamente el evento en el panel de eventos de anomalías. La lista de eventos que se muestra en el panel incluye todas las anomalías detectadas, además de las alertas activadas.