Visão geral da detecção de anomalias

A detecção de anomalias é uma técnica de mineração de dados que pode ser usada para identificar desvios nos dados em um determinado conjunto de dados. Por exemplo, se a taxa de devolução de um determinado produto aumentar substancialmente em relação ao valor de referência, isso pode indicar um defeito no produto ou uma possível fraude. Use a detecção de anomalias para detectar incidentes críticos, como problemas técnicos ou oportunidades, como alterações no comportamento do consumidor.

Um desafio do uso da detecção de anomalias é determinar o que conta como dados anômalos. Se você tiver dados rotulados que identificam anomalias, poderá realizar a detecção de anomalias usando a função ML.PREDICT com um dos seguintes modelos de machine learning supervisionado:

Se você não tiver certeza do que conta como dados anômalos ou não tiver dados rotulados para treinar um modelo, use o machine learning sem supervisão para realizar a detecção de anomalias. Use a função ML.DETECT_ANOMALIES com um dos seguintes modelos para detectar anomalias nos dados de treinamento ou nos novos dados de exibição:

Tipo de dado Tipos de modelos O que ML.DETECT_ANOMALIES faz
Série temporal ARIMA_PLUS Detecte as anomalias na série temporal.
ARIMA_PLUS_XREG Detectar as anomalias na série temporal com regressores externos.
Variáveis aleatórias independentes e distribuídas de maneira idêntica K-means Detecte anomalias com base na menor distância entre as distâncias normalizadas dos dados de entrada para cada centroide do cluster. Para uma definição de distâncias normalizadas, consulte Saída do modelo k-means para a função ML.DETECT_ANOMALIES..
Codificador automático Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio. Veja mais informações em ML.RECONSTRUCTION_LOSS. A função ML.RECONSTRUCTION_LOSS pode recuperar todos os tipos de perda de reconstrução.
PCA Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio.