Ringkasan deteksi anomali

Deteksi anomali adalah teknik penambangan data yang dapat Anda gunakan untuk mengidentifikasi penyimpangan data dalam set data tertentu. Misalnya, jika rasio pengembalian untuk produk tertentu meningkat secara substansial dari dasar pengukuran untuk produk tersebut, hal itu mungkin menunjukkan cacat produk atau potensi penipuan. Anda dapat menggunakan deteksi anomali untuk mendeteksi insiden penting, seperti masalah teknis, atau peluang, seperti perubahan perilaku konsumen.

Salah satu tantangan saat Anda menggunakan deteksi anomali adalah menentukan apa yang dianggap sebagai data anomali. Jika memiliki data berlabel yang mengidentifikasi anomali, Anda dapat melakukan deteksi anomali menggunakan fungsi ML.PREDICT dengan salah satu model machine learning terpandu berikut:

Jika tidak yakin apa yang dianggap sebagai data anomali, atau tidak memiliki data berlabel untuk melatih model, Anda dapat menggunakan machine learning tanpa pengawasan untuk melakukan deteksi anomali. Gunakan fungsi ML.DETECT_ANOMALIES dengan salah satu model berikut untuk mendeteksi anomali dalam data pelatihan atau data penayangan baru:

Jenis data Jenis model Yang dilakukan ML.DETECT_ANOMALIES
Deret waktu ARIMA_PLUS Mendeteksi anomali dalam deret waktu.
ARIMA_PLUS_XREG Mendeteksi anomali dalam deret waktu dengan regresor eksternal.
Variabel acak terdistribusi secara terdistribusi dan identik (IID) K-means Mendeteksi anomali berdasarkan jarak terpendek di antara jarak yang dinormalisasi dari data input ke setiap sentroid cluster. Untuk definisi jarak yang dinormalisasi, lihat output model k-means untuk fungsi ML.DETECT_ANOMALIES..
Autoencoder Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan kuadrat galat. Untuk informasi selengkapnya, lihat ML.RECONSTRUCTION_LOSS. Fungsi ML.RECONSTRUCTION_LOSS dapat mengambil semua jenis kehilangan rekonstruksi.
PCA Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan kuadrat galat.

Dengan menggunakan setelan default dalam pernyataan CREATE MODEL dan fungsi inferensi, Anda dapat membuat dan menggunakan model deteksi anomali meskipun tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang pengembangan ML membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan pengetahuan tentang teknik dan proses ML: