Halaman ini menjelaskan metrik evaluasi yang dapat digunakan untuk mendeteksi bias data, yang dapat muncul dalam data mentah dan nilai kebenaran nyata bahkan sebelum model dilatih. Untuk contoh dan notasi di halaman ini, kita akan menggunakan set data lamaran ke perguruan tinggi fiktif yang kami jelaskan secara mendetail di Pengantar evaluasi model untuk keadilan.
Untuk deskripsi tentang metrik yang dihasilkan dari data pasca-pelatihan, lihat Metrik bias model.
Ringkasan
Dalam set data lamaran ke perguruan tinggi fiktif kita, ada 200 pelamar dari California di slice 1 dan 100 pelamar dari Florida di slice 2, yang diberi label sebagai berikut:
Slice | Tolak | Terima |
---|---|---|
California | 140 | 60 |
Florida | 80 | 20 |
Anda biasanya dapat menafsirkan tanda untuk sebagian besar metrik sebagai berikut:
Nilai positif: menunjukkan potensi bias yang lebih condong ke slice 1 daripada slice 2.
Nilai nol: menunjukkan tidak ada bias antara slice 1 dan slice 2.
Nilai negatif: menunjukkan potensi bias yang lebih condong ke slice 2 daripada slice 1.
Kami mencatat jika hal ini tidak berlaku pada suatu metrik.
Perbedaan Ukuran Populasi
Perbedaan Ukuran Populasi mengukur apakah contoh di slice 1 lebih banyak daripada di slice 2, yang dinormalisasi berdasarkan total populasi kedua slice:
(total populasi slice 1 - total populasi slice 2)/(jumlah populasi di slice 1 dan 2)
Dalam contoh set data kita:
(200 pelamar California - 100 pelamar Florida)/300 total pelamar = 100/300 = 0,33.
Nilai positif Perbedaan Ukuran Populasi ini menunjukkan bahwa jumlah pelamar dari California secara tidak proporsional lebih banyak daripada pelamar dari Florida. Nilai positif ini mungkin atau mungkin tidak menunjukkan bias. Namun, jika model dilatih berdasarkan data ini, model mungkin belajar untuk berperforma lebih baik bagi pelamar dari California.
Perbedaan Proporsi Positif dalam Label Benar (DPPTL)
Perbedaan Proporsi Positif dalam Label Benar mengukur apakah set data secara tidak proporsional memiliki lebih banyak label kebenaran nyata positif untuk satu slice dibandingkan slice satunya. Metrik ini menghitung perbedaan Proporsi Positif dalam Label Benar antara slice 1 dan slice 2, di mana Proporsi Positif dalam Label Benar untuk sebuah slice adalah (Hasil positif yang diberi label/Total ukuran populasi). Metrik ini disebut juga Ketidakseimbangan Label:
(Hasil positif yang diberi label untuk slice 1/Total ukuran populasi slice 1) - (Hasil positif yang diberi label untuk slice 2/Total ukuran populasi slice 2)
Dalam contoh set data kita:
(60 pelamar California yang diterima/200 pelamar California) - (20 pelamar Florida yang diterima/100 pelamar Florida) = 60/200 - 20/100 = 0,1.
Nilai positif DPPTL menunjukkan bahwa set data ini secara tidak proporsional memiliki hasil positif yang lebih tinggi untuk pelamar dari California daripada untuk pelamar dari Florida. Nilai positif ini mungkin atau mungkin tidak menunjukkan bias. Namun, jika model dilatih berdasarkan data ini, model mungkin belajar untuk secara tidak proporsional memprediksi lebih banyak hasil positif untuk pelamar dari California.
Langkah berikutnya
Pelajari metrik bias model yang didukung oleh Vertex AI.