Visão geral da detecção de anomalias
A detecção de anomalias é uma técnica de mineração de dados que pode ser usada para identificar desvios nos dados em um determinado conjunto de dados. Por exemplo, se a taxa de devolução de um determinado produto aumentar substancialmente em relação ao valor de referência, isso pode indicar um defeito no produto ou uma possível fraude. Use a detecção de anomalias para detectar incidentes críticos, como problemas técnicos ou oportunidades, como alterações no comportamento do consumidor.
Um desafio do uso da detecção de anomalias é determinar o que conta como dados anômalos. Se você tiver dados rotulados que identificam anomalias, poderá realizar a detecção de anomalias usando a função ML.PREDICT
com um dos seguintes modelos de machine learning supervisionado:
- Modelos de regressão linear e logística
- Modelos de árvores aprimoradas
- Modelos de floresta aleatória
- Modelos de rede neural profunda (DNN)
- Amplitude e Modelos de rede profunda
- Modelos de AutoML
Se você não tiver certeza do que conta como dados anômalos ou não tiver dados rotulados para treinar um modelo, use o machine learning sem supervisão para realizar a detecção de anomalias. Use a
função ML.DETECT_ANOMALIES
com um dos seguintes modelos para detectar anomalias nos dados de treinamento ou nos novos dados de exibição:
Tipo de dado | Tipos de modelos | O que ML.DETECT_ANOMALIES faz |
---|---|---|
Série temporal | ARIMA_PLUS
|
Detecte as anomalias na série temporal. |
ARIMA_PLUS_XREG
|
Detectar as anomalias na série temporal com regressores externos. | |
Variáveis aleatórias independentes e distribuídas de maneira idêntica | K-means | Detecte anomalias com base na menor distância entre as distâncias normalizadas dos dados de entrada para cada centroide do cluster. Para uma definição de distâncias normalizadas, consulte Saída do modelo k-means para a função ML.DETECT_ANOMALIES .. |
Codificador automático | Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio. Veja mais informações em ML.RECONSTRUCTION_LOSS . A função ML.RECONSTRUCTION_LOSS pode recuperar todos os tipos de perda de reconstrução. |
|
PCA | Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio. |