Mengevaluasi keadilan model

Sangat penting untuk mengevaluasi keadilan model untuk menghindari bias dan diskriminasi yang terus-menerus. Halaman ini berfokus pada pentingnya penilaian keadilan dalam model penilaian risiko AML, memberikan insight tentang penerapan kesetaraan peluang (sebagai salah satu contoh ukuran), dan menyediakan rute potensial untuk mitigasi.

Relevansi

Ada beberapa alasan mengapa keadilan model harus dievaluasi, termasuk hal berikut:

  • Menciptakan atau memperkuat bias dan bahaya sosial yang negatif: Keadilan model sangat penting untuk mencegah diskriminasi terhadap individu berdasarkan atribut demografis mereka, seperti gender, ras, atau usia.
  • Kepatuhan terhadap peraturan: Bank harus mematuhi standar hukum dan etika, termasuk hukum dan peraturan anti-diskriminasi.
  • Mempertahankan kepercayaan: Keadilan dalam model penilaian risiko AML membantu menjaga kepercayaan pelanggan dan meningkatkan reputasi positif bagi bank.

Cara menghitung keadilan model

Ada beberapa cara untuk menilai keadilan dalam machine learning (lihat praktik terbaik umum). Sebaiknya pertimbangkan kesetaraan peluang untuk menilai keadilan model. Dalam konteks ini, kesetaraan peluang mengukur apakah model tersebut memberikan perlakuan yang sama kepada pihak-pihak dari grup demografi yang berbeda sehubungan dengan skor risiko mereka.

Untuk menghitung persamaan peluang, lakukan hal berikut:

  • Tentukan grup yang dilindungi yang ingin Anda uji keadilan modelnya:
    • Bank Anda biasanya memiliki tata kelola model pada kategori yang dilindungi. Informasi ini dapat mencakup gender, ras, usia berdasarkan kategori, dan kategori lainnya.
    • Di tabel Party, kolom yang kami rekomendasikan untuk digunakan memiliki catatan yang menyatakan "Biasanya juga digunakan untuk evaluasi keadilan".
  • Untuk setiap kategori yang dilindungi, hitung metrik berikut:

    • Rasio Positif Benar (TPR): Proporsi individu yang diklasifikasikan dengan benar sebagai berisiko tinggi di antara mereka yang benar-benar berisiko tinggi berdasarkan skor risiko yang ditetapkan oleh model.

      Rasio Negatif Palsu (FNR) adalah (1 - TPR). Ini adalah cara lain untuk mengukur seberapa sering model salah meleset target untuk grup tertentu.

    • Rasio Positif Palsu (FPR): Proporsi individu yang salah diklasifikasikan sebagai berisiko tinggi di antara mereka yang sebenarnya berisiko rendah berdasarkan skor risiko yang ditetapkan oleh model.

      Anda dapat menggunakan template skrip SQL ini untuk penghitungan, lalu menyesuaikannya sesuai kebutuhan dengan dimensi sensitif tertentu yang diperlukan untuk melakukan analisis keadilan.

  • Bandingkan nilai TPR dan FPR di berbagai grup demografis.

Pertimbangan penting dalam menghitung TPR dan FPR meliputi hal-hal berikut:

  • Tentukan dengan cermat kumpulan contoh lengkap yang akan menghitung TPR dan FPR; misalnya, menghitung semua pihak dalam satu lini bisnis satu kali pada tanggal tertentu d.
  • Tentukan dengan cermat hal yang menentukan contoh positif yang sebenarnya; misalnya, pihak yang menerima pemberitahuan dari sistem dan investigasi yang dimulai setelah tanggal d mengakibatkan pemicu proses keluar pelanggan karena alasan terkait AML.
  • Tentukan dengan cermat apa yang dianggap sebagai prediksi positif; misalnya, semua pelanggan yang skor risiko AML AI untuk tanggal d berada di atas nilai minimum skor risiko yang dipilih, yang akan Anda gunakan untuk memicu pemberitahuan.

Cara menafsirkan hasil dan pendekatan mitigasi

Rasio positif palsu yang lebih tinggi untuk bagian atau grup demografi tertentu berarti bahwa model lebih cenderung salah mengklasifikasikan individu dari kelompok tersebut sebagai berisiko tinggi, yang menyebabkan penyelidikan yang tidak perlu. Hal ini menunjukkan bahwa individu dari kelompok demografi tersebut ditandai secara tidak proporsional untuk diselidiki, yang berpotensi menyebabkan peningkatan pengawasan atau ketidaknyamanan bagi individu yang mungkin sebenarnya tidak menimbulkan risiko yang lebih tinggi.

Rasio positif benar yang lebih rendah untuk bagian atau grup demografi tertentu berarti bahwa model kurang efektif dalam mengklasifikasikan individu dari kelompok tersebut dengan benar sebagai berisiko tinggi, sehingga menghasilkan rasio negatif palsu yang lebih tinggi. Hal ini menunjukkan bahwa individu dari grup demografi tersebut yang seharusnya dilaporkan untuk diselidiki lebih mungkin terlewatkan atau diabaikan oleh model tersebut dibandingkan dengan kelompok lain.

Perbedaan FPR dan TPR, serta nilai minimum terkait kapan penyelidikan lebih lanjut harus dipertimbangkan dalam proses tata kelola risiko model Anda. Jika Anda memutuskan risiko tersebut perlu diselidiki lebih lanjut, berikut kemungkinan penyebab utama dan mitigasi yang perlu dipertimbangkan.

Kemungkinan penyebab utama

Daftar berikut menguraikan kemungkinan penyebab utama disparitas rasio positif palsu (PP) dan rasio positif benar di antara kelompok demografi:

  • Contoh positif yang tidak memadai: Anda belum mendapatkan cukup banyak pelanggan seperti ini (investigasi atau pemberitahuan positif tidak cukup). Anda mungkin belum menyelidiki dengan cukup atau pelanggan semacam ini tidak sering berisiko.
  • Banyak contoh positif yang tidak dibenarkan dengan benar: Anda mendeteksi bias laporan aktivitas mencurigakan defensif (SAR) atau bias keluar pelanggan terhadap kelompok pelanggan tertentu.
  • Total contoh tidak memadai: Jumlah pelanggan seperti ini kurang memadai dalam basis pelanggan Anda.

Aspek lain dari kualitas data dan pembuatan model juga dapat memengaruhi keadilan.

Opsi mitigasi

Daftar berikut menguraikan opsi mitigasi untuk akar masalah di bagian sebelumnya:

  • Pertimbangkan untuk mengalihkan kapasitas penyelidik ke grup pelanggan dengan TPR yang lebih tinggi dan / atau FPR yang lebih rendah untuk menyeimbangkan kembali nilai ini di masa mendatang
  • Meninjau proses investigasi dan investigasi historis untuk mendapatkan hasil yang bias untuk bagian dengan perbedaan yang signifikan dalam FPR atau TPR
  • Acak investigasi untuk mendapatkan lebih banyak contoh positif
  • Tinjau data tambahan pihak Anda (lihat Data tambahan). Pertimbangkan untuk menghapus data yang sangat terkait dengan kategori sensitif dan menambahkan data yang menyatakan faktor risiko yang mendasarinya (tidak bias). Misalnya, pertimbangkan kasus saat model notifikasi terkonsentrasi di beberapa kode pos tertentu. Faktor risiko yang mendasarinya dapat berupa konsentrasi bisnis yang memerlukan banyak uang tunai di sana, bukan area geografis itu sendiri.

Hal berikut tidak direkomendasikan:

  • Hapus pihak atau peristiwa kasus risiko untuk grup pelanggan tertentu guna menyeimbangkan kembali FPR atau TPR (sebenarnya, undersampling). Karena sifat jaringan dari data dan fitur AML AI, hal ini mungkin memiliki dampak yang tidak dapat diprediksi terhadap perilaku dan performa model.

Jika Anda masih mendapati bahwa tata kelola risiko model diblokir berdasarkan keadilan, sebaiknya terus gunakan versi mesin atau set data Anda saat ini dan hubungi dukungan untuk mendapatkan panduan tambahan.