Descripción general de la detección de anomalías
La detección de anomalías es una técnica de minería de datos que puede usar para identificar desviaciones de datos en un conjunto de datos determinado. Por ejemplo, si la tasa de devoluciones de un producto concreto aumenta considerablemente con respecto al valor de referencia de ese producto, podría indicar un defecto del producto o un posible fraude. Puede usar la detección de anomalías para detectar incidentes críticos, como problemas técnicos, u oportunidades, como cambios en el comportamiento de los consumidores.
Uno de los retos que se presentan al usar la detección de anomalías es determinar qué se considera datos anómalos. Si tienes datos etiquetados que identifican anomalías, puedes
realizar la detección de anomalías mediante la
función ML.PREDICT
con uno de los siguientes modelos de aprendizaje automático supervisado:
- Modelos de regresión lineal y logística
- Modelos de árboles de potenciación
- Modelos de bosque aleatorio
- Modelos de redes neuronales profundas (DNN)
- Modelos profundos y amplios
- Modelos de AutoML
Si no sabes con certeza qué se considera datos anómalos o no tienes datos etiquetados para entrenar un modelo, puedes usar el aprendizaje automático no supervisado para detectar anomalías. Usa la función ML.DETECT_ANOMALIES
con uno de los siguientes modelos para detectar anomalías en los datos de entrenamiento o en los datos de servicio nuevos:
Tipo de datos | Tipos de modelo | Qué hace ML.DETECT_ANOMALIES |
---|---|---|
Series temporales | ARIMA_PLUS
|
Detecta las anomalías en la serie temporal. |
ARIMA_PLUS_XREG
|
Detecta las anomalías de la serie temporal con regresores externos. | |
Variables aleatorias independientes e idénticamente distribuidas (IID) | K-medias | Detecta anomalías en función de la distancia más corta entre las distancias normalizadas de los datos de entrada y el centroide de cada clúster. Para ver la definición de las distancias normalizadas, consulta la salida del modelo de k-means de la función ML.DETECT_ANOMALIES . |
Autoencoder | Detecta anomalías en función de la pérdida de reconstrucción en términos de error cuadrático medio. Para obtener más información, consulta ML.RECONSTRUCTION_LOSS . La función ML.RECONSTRUCTION_LOSS puede
recuperar todos los tipos de pérdida de reconstrucción. |
|
PCA | Detecta anomalías en función de la pérdida de reconstrucción en términos de error cuadrático medio. |
Conocimientos recomendados
Si usas la configuración predeterminada en las instrucciones CREATE MODEL
y las funciones de inferencia, puedes crear y usar un modelo de detección de anomalías aunque no tengas muchos conocimientos sobre aprendizaje automático. Sin embargo, tener conocimientos básicos sobre el desarrollo de aprendizaje automático te ayuda a optimizar tanto tus datos como tu modelo para obtener mejores resultados. Te recomendamos que utilices los siguientes recursos para familiarizarte con las técnicas y los procesos de aprendizaje automático:
- Curso intensivo de aprendizaje automático
- Introducción al aprendizaje automático
- Aprendizaje automático intermedio