Ringkasan deteksi anomali
Deteksi anomali adalah teknik penambangan data yang dapat Anda gunakan untuk mengidentifikasi penyimpangan data dalam {i>dataset<i} tertentu. Misalnya, jika tingkat pengembalian untuk produk tertentu meningkat secara substansial dari dasar untuk produk tersebut, hal itu mungkin menunjukkan kerusakan produk atau potensi penipuan. Anda dapat menggunakan deteksi anomali untuk mendeteksi insiden kritis, seperti masalah teknis, atau peluang, seperti perubahan perilaku konsumen.
Satu kendala saat menggunakan deteksi anomali adalah menentukan apa yang dianggap sebagai data anomali. Jika telah memberi label pada data yang mengidentifikasi anomali, Anda dapat melakukan deteksi anomali dengan salah satu model supervised machine learning berikut:
- Model regresi linear dan regresi logistik
- Model pohon yang dioptimalkan
- Model hutan acak
- DNN dan model Lebar & Dalam
- Model AutoML
Jika tidak yakin apa yang dianggap sebagai data anomali, atau Anda tidak memiliki data berlabel untuk melatih model, Anda dapat menggunakan unsupervised machine learning untuk melakukan deteksi anomali. Gunakan fungsi ML.DETECT_ANOMALIES
dengan salah satu model berikut untuk mendeteksi anomali dalam data pelatihan atau data penayangan baru:
Jenis data | Jenis model | Yang dilakukan ML.DETECT_ANOMALIES |
---|---|---|
Deret waktu | ARIMA_PLUS
|
Mendeteksi anomali dalam deret waktu. |
ARIMA_PLUS_XREG
|
Deteksi anomali dalam deret waktu dengan regresi eksternal. | |
Variabel acak terdistribusi secara terdistribusi dan identik (IID) | K-means | Mendeteksi anomali berdasarkan jarak terpendek di antara jarak
yang dinormalisasi dari data input ke setiap sentroid cluster. Untuk definisi jarak yang dinormalkan, lihat Output model k-means untuk fungsi ML.DETECT_ANOMALIES .. |
Autoencoder | Deteksi anomali berdasarkan kerugian rekonstruksi dalam hal rata-rata
kuadrat error. Untuk informasi selengkapnya, lihat ML.RECONSTRUCTION_LOSS . Fungsi ML.RECONSTRUCTION_LOSS dapat mengambil semua jenis kerugian rekonstruksi. |
|
PCA | Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan kuadrat galat. |