Vertex AI のモデルバイアス指標

このページでは、モデルのトレーニング後にモデル予測出力に表示されるモデルバイアスの検出に使用できるモデル評価指標について説明します。このページの例と表記法では、公平性のためのモデル評価の概要で詳細に説明されている架空の大学出願データセットを使用します。

事前トレーニング データから生成される指標の説明については、データバイアス指標をご覧ください。

概要

サンプルの大学出願データセット内のスライス 1 にはカリフォルニア州の出願者 200 人、スライス 2 のフロリダ州の出願者 100 人が含まれています。モデルをトレーニングすると、次の混同行列が取得できます。

カリフォルニア州の出願者 合格(予測) 不合格(予測)
合格(正解) 50(真陽性) 10(偽陰性)
不合格(正解) 20(偽陽性) 120(真陰性)
フロリダ州の出願者 合格(予測) 不合格(予測)
合格(正解) 20(真陽性) 0(偽陰性)
不合格(正解) 30(正解) 50(正解)

一般的に、ほとんどの指標の符号は次のように解釈できます。

  • 正の値: スライス 2 よりもスライス 1 を優先する潜在的なバイアスを示します。

  • ゼロ値: スライス 1 とスライス 2 の間にバイアスがないことを示します。

  • 負の値: スライス 1 よりもスライス 2 を優先する場合の潜在的なバイアスを示します。

指標に該当しない場合、お知らせします。

精度の差

精度の差は、スライス 1 とスライス 2 の精度の差を測定します。

$$ \frac{tp_1 + tn_1}{n_1} - \frac{tp_2 + tn_2}{n_2} $$

((スライス 1 の真陽性 + スライス 1 の真陰性)÷ スライス 1 のインスタンス総数))-((スライス 2 の真陽性 + スライス 2 の真陰性)÷ スライス 2 のインスタンス総数)

サンプル データセットの場合:

((合格の予測が当たったカリフォルニア州の合格者 50 人 + 不合格の予測が当たったカリフォルニア州の不合格者 120 人)÷ カリフォルニア州の出願者 200 人)-((合格の予測が当たったフロリダ州の合格者 20 人 + 不合格の予測が当たったフロリダ州の不合格者 50 人)÷ フロリダ州の出願者 100 人)= 170 ÷ 200 - 70 ÷ 100 = 0.15

精度の差が正の値になる場合は、カリフォルニア州の出願者モデルの方がフロリダ州の出願者モデルよりも精度が高いことを示しています。これは、カリフォルニア州の応募者を優先する潜在的なバイアスを示している可能性があります。

予測ラベルの正の割合の差(DPPPL)

予測ラベルにおける正の割合(DPPPL)の差は、あるスライスが他のスライスよりも明らかに陽性の予測を行う傾向があるかどうかを測定します。DPPPL では、予測ラベルの正の割合の差を計算します。ここで、予測ラベルの正の割合は、スライスにおける(予測される陽性結果 ÷ インスタンスの総数)です。

$$ \frac{tp_1 + fp_1}{n_1} - \frac{tp_2 + fp_2}{n_2} $$

((スライス 1 の真陽性 + スライス 1 の偽陽性性)÷ スライス 1 のインスタンス総数))-((スライス 2 の真陽性 + スライス 2 の偽陽性)÷ スライス 2 のインスタンス総数)

サンプル データセット:

((合格の予測が当たったカリフォルニア州の合格者 50 人 + 不合格の予測が外れたカリフォルニア州の合格者 20 人)÷ カリフォルニア州の出願者 200 人)-((合格の予測が当たったフロリダ州の合格者 20 人 + 不合格の予測が外れたフロリダ州の合格者 30 人)÷ フロリダ州の出願者 100 人)= 70 ÷ 200 - 50 ÷ 100 = -0.15

DPPPL が負の値である場合は、モデルがカリフォルニア州の出願者に比べて、明らかにフロリダの出願者を合格としている傾向があることを示します。

再現率の差異

再現率の差異は、スライス 1 とスライス 2 の再現率の差を示し、ラベル付けされた陽性の結果のみに注目します。再現率の差異は、機会の均等とも呼ばれます。

$$ \frac{tp_1}{l^1_1} - \frac{tp_2}{l^1_2} $$

(スライス 1 の真陽性 ÷(スライス 1 の真陽性 + スライス 1 の偽陰性))-(スライス 2 の真陽性 ÷(スライス 2 の真陽性 + スライス 2 の偽陰性))

サンプル データセットの場合:

((合格の予測が当たったカリフォルニア州の合格者 50 人 ÷(合格の予測が当たったカリフォルニア州の合格者 50 人 + 合格の予測が外れたカリフォルニア州の不合格者 10 人))-((合格の予測が当たったフロリダ州の合格者 20 人 ÷(合格の予測が当たったフロリダ州の合格者 20 人)+ 合格の予測が外れたフロリダ州の不合格者 0 人)= 50 ÷ 60 - 20 ÷ 20 = -0.17

負の値になる場合は、モデルがカリフォルニア州の出願者よりもフロリダの出願者に対する再現性に優れていることを示します。つまり、このモデルは、カリフォルニア州の出願者よりも、フロリダ州の出願者をより正確に判断できる傾向があるということです。

特異性の差

特異度の差異は、スライス 1 とスライス 2 の特異性(真陰性率とも呼ばれます)の差を示します。 これは、ラベル付きの負の結果を別にすれば、再現率の差異と考えることができます。

$$ \frac{tn_1}{l^0_1} - \frac{tn_2}{l^0_2} $$

(スライス 1 の真陰性 ÷(スライス 1 の真陰性 + スライス 1 の偽陽性))-(スライス 2 の真陰性 ÷(スライス 2 の真陰性 + スライス 2 の偽陽性))

サンプル データセットの場合:

(不合格の予測が当たったカリフォルニア州の不合格者 120 人 ÷(不合格の予測が当たったカリフォルニア州の不合格者 120 人 + 不合格の予測が外れたカリフォルニア州の合格者 20 人))-(不合格の予測が当たったフロリダ州の不合格者 50 人 ÷(不合格の予測が当たったフロリダ州の不合格者 50 人 + 不合格の予測が外れたフロリダ州の合格者 30 人))= 120 ÷ 140 - 50 ÷ 80 = 0.23

正の値になる場合は、出願に対する不合格について、このモデルはフロリダの出願者よりもカリフォルニア州の出願者の再現率に優れていることを示しています。言い換えれば、このモデルは、カリフォルニア州の出願者よりもフロリダ州の出願者の不合格をより正確に判断する傾向があります。

エラータイプの比率の差

エラータイプの比率の差は、エラー(偽陰性と偽陽性)がスライス 1 と 2 でどのように分布しているかの違いを測定します。エラータイプの比率は、(偽陰性(タイプ I エラー)÷ 偽陽性(タイプ II エラー))として計算されます。エラータイプの比率の差は、処理平等性とも呼ばれます。

$$ \frac{fn_1}{fp_1} - \frac{fn_2}{fp_2} $$

(スライス 1 の偽陰性 ÷スライス 1 の偽陰性)-(スライス 2 の偽陰性 ÷ スライス 2 の偽陽性)

サンプル データセットの場合:

(合格の予測が外れたカリフォルニア州の不合格者 10 人 ÷ 不合格の予測が外れたカリフォルニア州の合格者 20 人)-(合格の予測が外れたフロリダ州の不合格者 0 人 ÷ 不合格の予測がはずれたフロリダ州の合格者 30 人)=(10 ÷ 20 - 0 ÷ 30)= 0.5

このモデルは、カリフォルニア州とフロリダの双方の出願者に対して 30 件のエラーを示していますが、エラータイプの比率の差の値は、モデルが実際よりもポジティブな結果を予測(偽陽性が高い)する傾向があることを示しています。したがって、カリフォルニア州の申請者の場合、フロリダの申請者と比べるとネガティブな結果を控えめに予測(偽陰性エラーが低い)する傾向が、フロリダ州の出願者の場合よりもカリフォルニア州の出願者の場合に強いことを示しています。

エラータイプの比率の差の符号は、一般的に次のように解釈できます。

  • 正の値: モデルでのスライス 1 の偽陰性エラーよりも、偽陽性エラーの数が大幅に多いことを示します。

  • ゼロ値: モデルの両方のスライスで同じ量の偽陽性エラーが発生していることを示します。

  • 負の値: モデルでのスライス 2 の偽陰性エラーよりも、偽陽性エラーの数が大幅に多いことを示します。

偽陰性または偽陽性の有害性はモデルの用途によって異なるため、この指標の符号は必ずしもモデルのバイアスを示しているわけではありません。

次のステップ