Membuat model

Halaman ini membahas konsep di balik pelatihan model secara singkat. Resource model AML AI mewakili model terlatih yang dapat digunakan untuk menghasilkan skor risiko dan penjelasannya.

Kapan harus melatih atau melatih ulang

AML AI melatih model sebagai bagian dari pembuatan Resource model. Model harus dilatih sebelum dapat dievaluasi (yaitu, diuji balik) atau digunakan untuk menghasilkan hasil prediksi.

Untuk performa terbaik dan mempertahankan model terbaru, pertimbangkan pelatihan ulang bulanan. Namun, versi mesin tertentu mendukung pembuatan hasil prediksi selama 12 bulan sejak rilis versi mesin minor yang lebih baru.

Cara melatih

Untuk melatih model (yaitu, membuat model), lihat Membuat dan mengelola model.

Secara khusus, Anda perlu memilih hal berikut:

  • Data yang akan digunakan untuk pelatihan:

    Tentukan set data dan waktu akhir dalam rentang tanggal set data.

    Pelatihan menggunakan label dan fitur berdasarkan bulan kalender lengkap hingga, tetapi tidak termasuk, bulan waktu akhir yang dipilih. Untuk mengetahui informasi selengkapnya, lihat Rentang waktu set data.

  • Konfigurasi mesin yang dibuat menggunakan set data yang konsisten:

    Lihat Mengonfigurasi mesin.

Output pelatihan

Pelatihan menghasilkan Resource model, yang dapat digunakan untuk melakukan hal berikut:

  • Membuat hasil pengujian balik, yang digunakan untuk mengevaluasi performa model menggunakan positif benar yang saat ini diketahui
  • Membuat hasil prediksi, yang digunakan setelah Anda siap untuk mulai meninjau kasus baru untuk potensi pencucian uang

Metadata model berisi metrik missingness, yang dapat digunakan untuk menilai konsistensi set data (misalnya, dengan membandingkan nilai ketidaklengkapan keluarga fitur dari operasi yang berbeda)

Nama metrik Deskripsi metrik Contoh nilai metrik
Ketidaklengkapan

Pangsa nilai yang tidak ada di semua fitur dalam setiap keluarga fitur.

Idealnya, semua keluarga fitur AI AML harus memiliki Missingness mendekati 0. Pengecualian dapat terjadi jika data yang mendasari grup fitur tersebut tidak tersedia untuk integrasi.

Perubahan yang signifikan pada nilai ini untuk setiap keluarga fitur antara penyesuaian, pelatihan, evaluasi, dan prediksi dapat menunjukkan inkonsistensi dalam set data yang digunakan.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Tingkat kepentingan

Metrik yang menunjukkan pentingnya keluarga fitur terhadap model. Nilai yang lebih tinggi menunjukkan penggunaan keluarga fitur yang lebih signifikan dalam model. Keluarga fitur yang tidak digunakan dalam model tidak memiliki kepentingan.

Nilai penting dapat digunakan saat memprioritaskan tindakan berdasarkan hasil kemiringan keluarga. Misalnya, nilai skew yang sama untuk keluarga dengan tingkat kepentingan yang lebih tinggi terhadap model lebih mendesak untuk diselesaikan.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Metadata model tidak berisi metrik recall dari set pengujian. Untuk membuat pengukuran recall selama jangka waktu tertentu (misalnya, set pengujian), lihat Mengevaluasi model.