Mengevaluasi keadilan model

Penting untuk mengevaluasi keadilan model guna menghindari bias dan diskriminasi yang berkelanjutan. Halaman ini berfokus pada pentingnya penilaian keadilan dalam model penskoran risiko AML, memberikan insight tentang penerapan kesetaraan odds (sebagai salah satu contoh pengukuran), dan memberikan potensi rute untuk mitigasi.

Relevansi

Ada beberapa alasan mengapa keadilan model harus dievaluasi, termasuk hal berikut:

  • Memicu atau memperparah bias dan bahaya sosial yang negatif: Keadilan model sangat penting untuk mencegah diskriminasi terhadap individu berdasarkan atribut demografis mereka, seperti gender, ras, atau usia.
  • Kepatuhan terhadap peraturan: Bank harus mematuhi standar hukum dan etika, termasuk hukum dan peraturan anti-diskriminasi.
  • Menjaga kepercayaan: Keadilan dalam model penskoran risiko AML membantu mempertahankan kepercayaan pelanggan dan mempromosikan reputasi positif bagi bank.

Cara menghitung keadilan model

Ada beberapa cara untuk menilai keadilan dalam machine learning (lihat praktik terbaik umum). Sebaiknya pertimbangkan kesetaraan peluang untuk menilai keadilan model. Dalam konteks ini, kesetaraan peluang mengukur apakah model memberikan perlakuan yang sama kepada pihak dari berbagai grup demografis sehubungan dengan skor risiko mereka.

Untuk menghitung kesetaraan peluang, lakukan hal berikut:

  • Tentukan grup yang dilindungi yang ingin Anda uji keadilan modelnya:
    • Bank Anda biasanya memiliki tata kelola model yang diterapkan pada kategori yang dilindungi. Hal ini dapat mencakup gender, ras, usia dalam bucket, dan kategori lainnya.
    • Di tabel Pihak, kolom yang kami rekomendasikan untuk digunakan memiliki catatan yang menyatakan "Biasanya juga digunakan untuk evaluasi keadilan".
  • Untuk setiap kategori yang dilindungi, hitung metrik berikut:

    • Rasio Positif Benar (TPR): Proporsi individu yang dengan benar diklasifikasikan sebagai berisiko tinggi di antara mereka yang benar-benar berisiko tinggi berdasarkan skor risiko yang ditetapkan oleh model.

      Rasio Negatif Palsu (FNR) adalah (1 - TPR). Ini adalah cara lain untuk mengukur seberapa sering model salah melewatkan target untuk grup tertentu.

    • Rasio Positif Palsu (FPR): Proporsi individu yang salah diklasifikasikan sebagai berisiko tinggi di antara mereka yang sebenarnya berisiko rendah berdasarkan skor risiko yang ditetapkan oleh model.

      Anda dapat menggunakan template skrip SQL ini untuk penghitungan, dengan menyesuaikan sesuai kebutuhan ke dimensi sensitif tertentu yang perlu Anda lakukan analisis keadilan.

  • Bandingkan nilai TPR dan FPR di berbagai grup demografis.

Pertimbangan penting dalam menghitung TPR dan FPR mencakup hal-hal berikut:

  • Tentukan dengan cermat kumpulan lengkap contoh yang akan digunakan untuk menghitung TPR dan FPR; misalnya, menghitung semua pihak dalam satu lini bisnis sekali pada tanggal tertentu d.
  • Tentukan dengan cermat apa yang menentukan contoh positif yang sebenarnya; misalnya, pihak yang menerima pemberitahuan dari sistem dan investigasi apa pun yang dimulai setelah tanggal d mengakibatkan pemicuan proses keluar pelanggan karena alasan terkait AML.
  • Tentukan dengan cermat apa yang dianggap sebagai prediksi positif; misalnya, semua pelanggan yang skor risiko AML AI-nya untuk tanggal d berada di atas nilai minimum skor risiko yang dipilih, yang akan Anda gunakan untuk memicu pemberitahuan.

Cara menafsirkan hasil dan pendekatan mitigasi

Rasio positif palsu yang lebih tinggi untuk bagian atau grup demografis tertentu berarti model lebih cenderung salah mengklasifikasikan individu dari grup tersebut sebagai berisiko tinggi, sehingga menyebabkan investigasi yang tidak perlu. Hal ini menunjukkan bahwa individu dari grup demografi tersebut ditandai secara tidak proporsional untuk diinvestigasi, yang berpotensi menyebabkan peningkatan pemeriksaan atau ketidaknyamanan bagi individu yang mungkin sebenarnya tidak menimbulkan risiko yang lebih tinggi.

Rasio positif benar yang lebih rendah untuk bagian atau grup demografi tertentu berarti model kurang efektif dalam mengklasifikasikan individu dari grup tersebut sebagai berisiko tinggi dengan benar, sehingga menghasilkan rasio negatif palsu yang lebih tinggi. Hal ini menunjukkan bahwa individu dari grup demografi tersebut yang seharusnya ditandai untuk diinvestigasi lebih cenderung terlewat atau diabaikan oleh model dibandingkan dengan grup lain.

Perbedaan dalam FPR dan TPR, serta nilai minimum untuk waktu menyelidiki lebih lanjut harus dipertimbangkan dalam proses tata kelola risiko model Anda. Jika Anda memutuskan bahwa risiko tersebut memerlukan penyelidikan lebih lanjut, berikut adalah kemungkinan penyebab utama dan mitigasi yang perlu dipertimbangkan.

Kemungkinan penyebab utama

Daftar berikut menguraikan potensi akar penyebab perbedaan dalam rasio positif salah dan rasio positif benar antara kelompok demografis:

  • Contoh positif tidak memadai: Anda belum menangkap cukup banyak pelanggan seperti ini (tidak cukup penyelidikan atau pemberitahuan positif). Anda mungkin tidak melakukan penyelidikan yang cukup atau pelanggan semacam ini tidak terlalu berisiko.
  • Banyak contoh positif yang tidak dibenarkan dengan benar: Anda mendeteksi bias laporan aktivitas mencurigakan (SAR) defensif atau bias keluar pelanggan terhadap grup pelanggan tertentu.
  • Total contoh tidak memadai: Anda tidak memiliki cukup pelanggan semacam ini di basis pelanggan.

Aspek lain dari kualitas data dan pembuatan model juga dapat memengaruhi keadilan.

Opsi mitigasi

Daftar berikut menguraikan opsi mitigasi untuk akar masalah di bagian sebelumnya:

  • Pertimbangkan untuk mengalihkan kapasitas penyelidik ke grup pelanggan dengan TPR yang lebih tinggi dan / atau FPR yang lebih rendah untuk menyeimbangkan kembali nilai ini di masa mendatang
  • Tinjau proses investigasi dan investigasi historis untuk mengetahui hasil yang bias untuk slice dengan perbedaan FPR atau TPR yang signifikan
  • Mengacak investigasi untuk mendapatkan lebih banyak contoh positif
  • Tinjau data tambahan pihak Anda (lihat Data tambahan). Pertimbangkan untuk menghapus data yang sangat berkorelasi dengan kategori sensitif dan menambahkan data yang mengungkapkan faktor risiko yang mendasari (tidak bias). Misalnya, pertimbangkan kasus saat pemberitahuan model terkonsentrasi di beberapa kode pos tertentu. Faktor risiko yang mendasarinya dapat berupa konsentrasi bisnis yang membutuhkan banyak uang tunai di sana, bukan area geografis itu sendiri.

Hal berikut tidak direkomendasikan:

  • Hapus pihak atau peristiwa kasus risiko untuk grup pelanggan tertentu guna menyeimbangi FPR atau TPR (pada dasarnya, undersampling). Karena sifat jaringan data dan fitur AML AI, hal ini dapat berdampak tidak terduga pada perilaku dan performa model.

Jika Anda masih mendapati bahwa tata kelola risiko model diblokir karena ketidakadilan, sebaiknya lanjutkan menggunakan versi mesin atau set data saat ini dan hubungi dukungan untuk mendapatkan panduan tambahan.