Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Ringkasan deteksi anomali
Deteksi anomali adalah teknik penambangan data yang dapat Anda gunakan untuk mengidentifikasi penyimpangan data dalam set data tertentu. Misalnya, jika rasio pengembalian untuk produk tertentu
meningkat secara substansial dari dasar pengukuran untuk produk tersebut, hal itu mungkin
menunjukkan cacat produk atau potensi penipuan. Anda dapat menggunakan deteksi anomali untuk
mendeteksi insiden penting, seperti masalah teknis, atau peluang, seperti
perubahan perilaku konsumen.
Salah satu tantangan saat Anda menggunakan deteksi anomali adalah menentukan apa yang dianggap sebagai
data anomali. Jika memiliki data berlabel yang mengidentifikasi anomali, Anda dapat
melakukan deteksi anomali menggunakan
fungsi ML.PREDICT
dengan salah satu model machine learning terpandu berikut:
Jika tidak yakin apa yang dianggap sebagai data anomali, atau tidak memiliki data berlabel untuk melatih model, Anda dapat menggunakan machine learning tanpa pengawasan untuk melakukan deteksi anomali. Gunakan
fungsi ML.DETECT_ANOMALIES
dengan salah satu model berikut untuk mendeteksi anomali dalam data pelatihan atau data
penayangan baru:
Mendeteksi anomali berdasarkan jarak terpendek di antara jarak
yang dinormalisasi dari data input ke setiap sentroid cluster. Untuk definisi jarak yang dinormalisasi, lihat output model k-means untuk fungsi ML.DETECT_ANOMALIES..
Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan
kuadrat galat. Untuk informasi selengkapnya, lihat ML.RECONSTRUCTION_LOSS. Fungsi ML.RECONSTRUCTION_LOSS dapat
mengambil semua jenis kehilangan rekonstruksi.
Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan
kuadrat galat.
Artikel pusat informasi yang direkomendasikan
Dengan menggunakan setelan default dalam pernyataan CREATE MODEL dan fungsi inferensi, Anda dapat membuat dan menggunakan model deteksi anomali meskipun tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang pengembangan ML membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan
pengetahuan tentang teknik dan proses ML:
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-09-09 UTC."],[[["\u003cp\u003eAnomaly detection is a data mining technique used to identify deviations in datasets, which can signal product defects, fraud, or changes in consumer behavior.\u003c/p\u003e\n"],["\u003cp\u003eIf you have labeled data, supervised machine learning models like linear regression, boosted trees, random forest, DNN, Wide & Deep, and AutoML models can be used with the \u003ccode\u003eML.PREDICT\u003c/code\u003e function for anomaly detection.\u003c/p\u003e\n"],["\u003cp\u003eWhen you lack labeled data or are uncertain about what constitutes anomalous data, unsupervised machine learning can be employed with the \u003ccode\u003eML.DETECT_ANOMALIES\u003c/code\u003e function.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003eML.DETECT_ANOMALIES\u003c/code\u003e function supports various model types, including ARIMA_PLUS, ARIMA_PLUS_XREG, K-means, Autoencoder, and PCA, each suited for different data types such as time series or independent and identically distributed random variables.\u003c/p\u003e\n"],["\u003cp\u003eBasic knowledge of ML can enhance anomaly detection results, and resources such as the Machine Learning Crash Course, Intro to Machine Learning, and Intermediate Machine Learning are recommended to develop this knowledge.\u003c/p\u003e\n"]]],[],null,["# Anomaly detection overview\n==========================\n\nAnomaly detection is a data mining technique that you can use to identify data\ndeviations in a given dataset. For example, if the return rate for a given\nproduct increases substantially from the baseline for that product, that might\nindicate a product defect or potential fraud. You can use anomaly detection to\ndetect critical incidents, such as technical issues, or opportunities, such as\nchanges in consumer behavior.\n\nOne challenge when you use anomaly detection is determining what counts as\nanomalous data. If you have labeled data that identifies anomalies, you can\nperform anomaly detection by using the\n[`ML.PREDICT` function](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-predict)\nwith one of the following supervised machine learning models:\n\n- [Linear and logistic regression models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-glm)\n- [Boosted trees models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-boosted-tree)\n- [Random forest models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-random-forest)\n- [Deep neural network (DNN) models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-dnn-models)\n- [Wide \\& Deep models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-wnd-models)\n- [AutoML models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-automl)\n\nIf you aren't certain what counts as anomalous data, or you don't have labeled\ndata to train a model on, you can use unsupervised machine learning to perform\nanomaly detection. Use the\n[`ML.DETECT_ANOMALIES` function](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-detect-anomalies)\nwith one of the following models to detect anomalies in training data or new\nserving data:\n\nRecommended knowledge\n---------------------\n\nBy using the default settings in the `CREATE MODEL` statements and the\ninference functions, you can create and use an anomaly detection\nmodel even without much ML knowledge. However, having basic knowledge about\nML development helps you optimize both your data and your model to\ndeliver better results. We recommend using the following resources to develop\nfamiliarity with ML techniques and processes:\n\n- [Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course)\n- [Intro to Machine Learning](https://www.kaggle.com/learn/intro-to-machine-learning)\n- [Intermediate Machine Learning](https://www.kaggle.com/learn/intermediate-machine-learning)"]]