Membuat model

Halaman ini secara singkat membahas konsep di balik pelatihan model.

Kapan harus melatih atau melatih ulang

AML AI melatih model sebagai bagian dari pembuatan resource Model. Model harus dilatih sebelum dapat dievaluasi (yaitu, diuji kembali) atau digunakan untuk menghasilkan hasil prediksi.

Untuk mendapatkan performa terbaik dan mempertahankan model terbaru, pertimbangkan pelatihan ulang setiap bulan. Namun, versi mesin tertentu mendukung pembuatan hasil prediksi selama 12 bulan sejak rilis versi mesin minor yang lebih baru.

Cara melatih

Untuk melatih model (yaitu, membuat model), lihat Membuat dan mengelola model.

Secara khusus, Anda harus memilih hal berikut:

  • Data yang akan digunakan untuk pelatihan:

    Tentukan set data dan waktu berakhir dalam rentang tanggal set data.

    Pelatihan menggunakan label dan fitur berdasarkan bulan kalender yang selesai hingga, tetapi tidak termasuk, bulan dari waktu berakhir yang dipilih. Untuk mengetahui informasi selengkapnya, lihat Rentang waktu set data.

  • Konfigurasi mesin yang dibuat menggunakan set data yang konsisten:

    Lihat Mengonfigurasi mesin.

Output pelatihan

Pelatihan menghasilkan Resource model, yang dapat digunakan untuk melakukan hal berikut:

  • Membuat hasil backtest, yang digunakan untuk mengevaluasi performa model menggunakan positif benar yang saat ini diketahui
  • Buat hasil prediksi yang digunakan setelah Anda siap untuk mulai meninjau kasus baru terkait potensi pencucian uang

Metadata model berisi metrik berikut. Secara khusus, metrik ini menunjukkan perubahan besar terkait kelompok fitur yang didukung set data (antara penyesuaian mesin, pelatihan, evaluasi, dan prediksi).

Nama metrik Deskripsi metrik Contoh nilai metrik
Hilang

Berbagi nilai yang tidak ada di semua fitur dalam setiap kelompok fitur.

Idealnya, semua kelompok fitur AML AI harus memiliki Nilai Hilang mendekati 0. Pengecualian dapat terjadi jika data yang mendasari kelompok fitur tersebut tidak tersedia untuk integrasi.

Perubahan signifikan pada nilai ini untuk kelompok fitur apa pun antara penyesuaian, pelatihan, evaluasi, dan prediksi dapat menunjukkan inkonsistensi dalam set data yang digunakan.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Tingkat kepentingan

Metrik yang menunjukkan pentingnya kelompok fitur bagi model. Nilai yang lebih tinggi menunjukkan penggunaan kelompok fitur yang lebih signifikan dalam model. Kelompok fitur yang tidak digunakan dalam model tidak memiliki kepentingan apa pun.

Nilai kepentingan dapat digunakan saat memprioritaskan tindakan pada hasil yang condong pada keluarga. Misalnya, nilai kecondongan yang sama untuk keluarga dengan kepentingan yang lebih tinggi terhadap model akan lebih mendesak untuk diselesaikan.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Metadata model tidak berisi metrik recall dari set pengujian. Untuk menghasilkan pengukuran recall selama jangka waktu tertentu (misalnya set pengujian), lihat Mengevaluasi model.