Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Panoramica del rilevamento di anomalie
Il rilevamento delle anomalie è una tecnica di data mining che puoi utilizzare per identificare le deviazioni dei dati in un determinato set di dati. Ad esempio, se il tasso di reso di un determinato prodotto aumenta notevolmente rispetto al valore di riferimento, potrebbe indicare un difetto del prodotto o una potenziale attività fraudolenta. Puoi utilizzare il rilevamento delle anomalie per rilevare incidenti critici, come problemi tecnici, o opportunità, come cambiamenti nel comportamento dei consumatori.
Un problema che si verifica quando utilizzi il rilevamento delle anomalie è determinare cosa viene considerato come dato anomalo. Se disponi di dati etichettati che identificano anomalie, puoi eseguire il rilevamento di anomalie utilizzando la funzione ML.PREDICT con uno dei seguenti modelli di machine learning supervisionato:
Se non sai con certezza quali dati sono considerati anomali o se non hai dati etichettati su cui addestrare un modello, puoi utilizzare il machine learning non supervisionato per eseguire il rilevamento delle anomalie. Utilizza la
funzione ML.DETECT_ANOMALIES
con uno dei seguenti modelli per rilevare anomalie nei dati di addestramento o nei nuovi
dati di pubblicazione:
Rileva le anomalie in base alla distanza più breve tra le distanze normalizzate
dai dati di input a ciascun centroide del cluster. Per una definizione delle distanze normalizzate, consulta l'output del modello k-means per la funzione ML.DETECT_ANOMALIES.
Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio. Per ulteriori informazioni, vedi ML.RECONSTRUCTION_LOSS. La funzione ML.RECONSTRUCTION_LOSS può recuperare tutti i tipi di perdita di ricostruzione.
Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio.
Conoscenze consigliate
Utilizzando le impostazioni predefinite nelle istruzioni CREATE MODEL e nelle funzioni di inferenza, puoi creare e utilizzare un modello di rilevamento delle anomalie anche senza molte conoscenze di ML. Tuttavia, avere conoscenze di base sullo sviluppo del ML ti aiuta a ottimizzare sia i dati sia il modello per ottenere risultati migliori. Ti consigliamo di utilizzare le seguenti risorse per acquisire familiarità con le tecniche e le procedure di ML:
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[[["\u003cp\u003eAnomaly detection is a data mining technique used to identify deviations in datasets, which can signal product defects, fraud, or changes in consumer behavior.\u003c/p\u003e\n"],["\u003cp\u003eIf you have labeled data, supervised machine learning models like linear regression, boosted trees, random forest, DNN, Wide & Deep, and AutoML models can be used with the \u003ccode\u003eML.PREDICT\u003c/code\u003e function for anomaly detection.\u003c/p\u003e\n"],["\u003cp\u003eWhen you lack labeled data or are uncertain about what constitutes anomalous data, unsupervised machine learning can be employed with the \u003ccode\u003eML.DETECT_ANOMALIES\u003c/code\u003e function.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003eML.DETECT_ANOMALIES\u003c/code\u003e function supports various model types, including ARIMA_PLUS, ARIMA_PLUS_XREG, K-means, Autoencoder, and PCA, each suited for different data types such as time series or independent and identically distributed random variables.\u003c/p\u003e\n"],["\u003cp\u003eBasic knowledge of ML can enhance anomaly detection results, and resources such as the Machine Learning Crash Course, Intro to Machine Learning, and Intermediate Machine Learning are recommended to develop this knowledge.\u003c/p\u003e\n"]]],[],null,["# Anomaly detection overview\n==========================\n\nAnomaly detection is a data mining technique that you can use to identify data\ndeviations in a given dataset. For example, if the return rate for a given\nproduct increases substantially from the baseline for that product, that might\nindicate a product defect or potential fraud. You can use anomaly detection to\ndetect critical incidents, such as technical issues, or opportunities, such as\nchanges in consumer behavior.\n\nOne challenge when you use anomaly detection is determining what counts as\nanomalous data. If you have labeled data that identifies anomalies, you can\nperform anomaly detection by using the\n[`ML.PREDICT` function](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-predict)\nwith one of the following supervised machine learning models:\n\n- [Linear and logistic regression models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-glm)\n- [Boosted trees models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-boosted-tree)\n- [Random forest models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-random-forest)\n- [Deep neural network (DNN) models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-dnn-models)\n- [Wide \\& Deep models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-wnd-models)\n- [AutoML models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-automl)\n\nIf you aren't certain what counts as anomalous data, or you don't have labeled\ndata to train a model on, you can use unsupervised machine learning to perform\nanomaly detection. Use the\n[`ML.DETECT_ANOMALIES` function](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-detect-anomalies)\nwith one of the following models to detect anomalies in training data or new\nserving data:\n\nRecommended knowledge\n---------------------\n\nBy using the default settings in the `CREATE MODEL` statements and the\ninference functions, you can create and use an anomaly detection\nmodel even without much ML knowledge. However, having basic knowledge about\nML development helps you optimize both your data and your model to\ndeliver better results. We recommend using the following resources to develop\nfamiliarity with ML techniques and processes:\n\n- [Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course)\n- [Intro to Machine Learning](https://www.kaggle.com/learn/intro-to-machine-learning)\n- [Intermediate Machine Learning](https://www.kaggle.com/learn/intermediate-machine-learning)"]]