Esta página foi traduzida pela API Cloud Translation.

Visão geral da detecção de anomalias

A detecção de anomalias é uma técnica de mineração de dados que pode ser usada para identificar desvios nos dados em um determinado conjunto de dados. Por exemplo, se a taxa de devolução de um determinado produto aumentar substancialmente em relação ao valor de referência, isso pode indicar um defeito no produto ou uma possível fraude. Use a detecção de anomalias para detectar incidentes críticos, como problemas técnicos ou oportunidades, como alterações no comportamento do consumidor.

Um desafio do uso da detecção de anomalias é determinar o que conta como dados anômalos. Se você tiver dados rotulados que identificam anomalias, poderá realizar a detecção de anomalias usando a função ML.PREDICT com um dos seguintes modelos de machine learning supervisionado:

Se você não tiver certeza do que conta como dados anômalos ou não tiver dados rotulados para treinar um modelo, use o machine learning sem supervisão para realizar a detecção de anomalias. Use a função ML.DETECT_ANOMALIES com um dos seguintes modelos para detectar anomalias nos dados de treinamento ou nos novos dados de exibição:

Tipo de dado	Tipos de modelos	O que `ML.DETECT_ANOMALIES` faz
Série temporal	`ARIMA_PLUS`	Detecte as anomalias na série temporal.
Série temporal	`ARIMA_PLUS_XREG`	Detectar as anomalias na série temporal com regressores externos.
Variáveis aleatórias independentes e distribuídas de maneira idêntica	K-means	Detecte anomalias com base na menor distância entre as distâncias normalizadas dos dados de entrada para cada centroide do cluster. Para uma definição de distâncias normalizadas, consulte Saída do modelo k-means para a função `ML.DETECT_ANOMALIES`..
	Codificador automático	Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio. Veja mais informações em `ML.RECONSTRUCTION_LOSS`. A função `ML.RECONSTRUCTION_LOSS` pode recuperar todos os tipos de perda de reconstrução.
	PCA	Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio.

Conhecimento recomendado

Usando as configurações padrão nas instruções CREATE MODEL e nas funções de inferência, é possível criar e usar um modelo de detecção de anomalias mesmo sem muito conhecimento de ML. No entanto, ter conhecimentos básicos sobre o desenvolvimento de ML ajuda a otimizar os dados e o modelo para obter melhores resultados. Recomendamos o uso dos seguintes recursos para se familiarizar com as técnicas e os processos de ML: