Ringkasan deteksi anomali
Deteksi anomali adalah teknik penambangan data yang dapat Anda gunakan untuk mengidentifikasi penyimpangan data dalam set data tertentu. Misalnya, jika rasio pengembalian untuk produk tertentu meningkat secara substansial dari dasar pengukuran untuk produk tersebut, hal itu mungkin menunjukkan cacat produk atau potensi penipuan. Anda dapat menggunakan deteksi anomali untuk mendeteksi insiden penting, seperti masalah teknis, atau peluang, seperti perubahan perilaku konsumen.
Salah satu tantangan saat Anda menggunakan deteksi anomali adalah menentukan apa yang dianggap sebagai
data anomali. Jika memiliki data berlabel yang mengidentifikasi anomali, Anda dapat
melakukan deteksi anomali menggunakan
fungsi ML.PREDICT
dengan salah satu model machine learning terpandu berikut:
- Model regresi linear dan logistik
- Model hierarki yang ditingkatkan
- Model hutan acak
- Model jaringan neural dalam (DNN)
- Model Wide & Deep
- Model AutoML
Jika tidak yakin apa yang dianggap sebagai data anomali, atau tidak memiliki data berlabel untuk melatih model, Anda dapat menggunakan machine learning tanpa pengawasan untuk melakukan deteksi anomali. Gunakan
fungsi ML.DETECT_ANOMALIES
dengan salah satu model berikut untuk mendeteksi anomali dalam data pelatihan atau data
penayangan baru:
Jenis data | Jenis model | Yang dilakukan ML.DETECT_ANOMALIES |
---|---|---|
Deret waktu | ARIMA_PLUS
|
Mendeteksi anomali dalam deret waktu. |
ARIMA_PLUS_XREG
|
Mendeteksi anomali dalam deret waktu dengan regresor eksternal. | |
Variabel acak terdistribusi secara terdistribusi dan identik (IID) | K-means | Mendeteksi anomali berdasarkan jarak terpendek di antara jarak
yang dinormalisasi dari data input ke setiap sentroid cluster. Untuk definisi jarak yang dinormalisasi, lihat output model k-means untuk fungsi ML.DETECT_ANOMALIES .. |
Autoencoder | Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan
kuadrat galat. Untuk informasi selengkapnya, lihat ML.RECONSTRUCTION_LOSS . Fungsi ML.RECONSTRUCTION_LOSS dapat
mengambil semua jenis kehilangan rekonstruksi. |
|
PCA | Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan kuadrat galat. |
Artikel pusat informasi yang direkomendasikan
Dengan menggunakan setelan default dalam pernyataan CREATE MODEL
dan fungsi inferensi, Anda dapat membuat dan menggunakan model deteksi anomali meskipun tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang pengembangan ML membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan
pengetahuan tentang teknik dan proses ML: