Avaliar a imparcialidade do modelo

É crucial avaliar a imparcialidade do modelo para evitar perpetuar vieses e discriminação. Esta página se concentra na importância da avaliação de justiça em modelos de pontuação de risco de AML, oferece insights sobre a aplicação da igualdade de chances (como uma medida de exemplo) e fornece possíveis rotas para mitigações.

Relevância

Há vários motivos para avaliar a imparcialidade do modelo, incluindo:

  • Criar ou amplificar vieses e danos sociais negativos: a imparcialidade do modelo é vital para evitar a discriminação contra indivíduos com base nos atributos demográficos deles, como gênero, raça ou idade.
  • Compliance regulatório: os bancos precisam obedecer a padrões legais e éticos, incluindo leis e regulamentos antidiscriminatórios.
  • Manter a confiança: a imparcialidade nos modelos de pontuação de risco de AML ajuda a manter a confiança do cliente e promove uma reputação positiva para o banco.

Como calcular a imparcialidade do modelo

Há várias maneiras de avaliar a imparcialidade no machine learning (consulte práticas recomendadas gerais). Recomendamos considerar a igualdade de chances para avaliar a imparcialidade do modelo. Nesse contexto, a igualdade de probabilidades mede se o modelo oferece tratamento igual a partes de diferentes grupos demográficos com relação às pontuações de risco.

Para calcular a igualdade de probabilidades, faça o seguinte:

  • Defina os grupos protegidos que você quer testar a imparcialidade do modelo:
    • Normalmente, o banco tem governança de modelo em categorias protegidas. Isso pode incluir gênero, raça, idade e outras categorias.
    • Na tabela Parte, os campos que recomendamos usar têm uma observação "Normalmente também usados para avaliação de justiça".
  • Para cada categoria protegida, calcule as seguintes métricas:

    • Taxa de verdadeiro positivo (TPR, na sigla em inglês): a proporção de indivíduos corretamente classificados como de alto risco entre aqueles que realmente apresentam alto risco com base nas pontuações de risco atribuídas pelo modelo.

      A taxa de falsos negativos (FNR) é (1 - TPR). Essa é outra maneira de medir com que frequência um modelo erra o alvo de um determinado grupo.

    • Taxa de falsos positivos (FPR, na sigla em inglês): a proporção de indivíduos incorretamente classificados como de alto risco entre aqueles que são de baixo risco com base nas pontuações de risco atribuídas pelo modelo.

      Use este modelo de script SQL para o cálculo, ajustando conforme necessário às dimensões sensíveis específicas para as quais você precisa fazer a análise de imparcialidade.

  • Compare os valores de TPR e FPR em diferentes grupos demográficos.

Considerações importantes na computação da TPR e da FPR incluem:

  • Especifique cuidadosamente o conjunto completo de exemplos para os quais o TPR e o FPR serão calculados. Por exemplo, conte todas as partes em uma única linha de negócios em uma data específica d.
  • Especifique com cuidado o que define um exemplo positivo real. Por exemplo, uma parte para quem qualquer alerta de qualquer sistema e investigação iniciada após a data d resultou na ativação do processo de saída do cliente por motivos relacionados ao AML.
  • Especifique com cuidado o que conta como uma previsão positiva. Por exemplo, todos os clientes com pontuações de risco da AML AI para a data d estão acima de um limite de pontuação de risco escolhido, que você usaria para acionar alertas.

Como interpretar os resultados e as abordagens de mitigação

Uma taxa de falsos positivos mais alta para uma fatia ou grupo demográfico específico significa que o modelo tem mais probabilidade de classificar incorretamente indivíduos desse grupo como de alto risco, o que leva a investigações desnecessárias. Isso indica que indivíduos desse grupo demográfico estão sendo sinalizados de forma desproporcional para investigação, o que pode resultar em maior escrutínio ou inconveniência para indivíduos que podem não representar um risco maior.

Uma taxa de verdadeiro positivo mais baixa para uma fatia ou grupo demográfico específico significa que o modelo é menos eficaz na classificação correta de indivíduos desse grupo como de alto risco, resultando em uma taxa mais alta de falsos negativos. Isso indica que indivíduos desse grupo demográfico que precisam ser sinalizados para investigação têm mais probabilidade de serem ignorados pelo modelo em comparação com outros grupos.

As disparidades nas FPRs e TPRs, e os limites para investigar isso mais detalhadamente, devem ser considerados no seu processo de governança de risco do modelo. Se você decidir que o risco merece uma investigação mais aprofundada, considere as possíveis causas raiz e mitigações a seguir.

Possíveis causas raiz

A lista a seguir descreve as possíveis causas das disparidades na taxa de falso positivo e na taxa de verdadeiro positivo entre os grupos demográficos:

  • Exemplos positivos insuficientes: você não detectou esse tipo de cliente (não há investigações ou alertas positivos suficientes). Talvez você não esteja investigando o suficiente ou esse tipo de cliente não é muito arriscado.
  • Muitos exemplos positivos que não são justificados corretamente: você detecta viés de relatório de atividade suspeita (SAR, na sigla em inglês) defensivo ou viés de saída do cliente em relação a um grupo de clientes específico.
  • Exemplos totais insuficientes: você não tem esse tipo de cliente suficiente na sua base de clientes.

Outros aspectos da qualidade dos dados e da geração de modelos também podem afetar a imparcialidade.

Opções de mitigação

A lista a seguir descreve as opções de mitigação para as causas raiz na seção anterior:

  • Considere redirecionar a capacidade dos investigadores para grupos de clientes com TPR mais alto e / ou FPR mais baixo para reequilibrar esses valores no futuro.
  • Analisar o processo de investigação e as investigações anteriores para resultados tendenciosos de fatias com disparidade significativa na FPR ou TPR
  • Randomize as investigações para receber mais exemplos positivos
  • Analise os dados suplementares da parte (consulte Dados suplementares). Considere remover dados que se correlacionam muito com categorias sensíveis e adicionar dados que expressem o fator de risco subjacente (sem viés). Por exemplo, considere um caso em que os alertas do modelo estão concentrados em alguns CEPs. O fator de risco subjacente pode ser uma concentração de empresas com grande volume de caixa, e não a área geográfica em si.

O seguinte não é recomendado:

  • Remova partes ou eventos de casos de risco de grupos de clientes específicos para reequilibrar a FPR ou TPR (em vigor, subamostragem). Devido à natureza da rede de dados e recursos de IA de AML, isso pode ter um impacto imprevisível no comportamento e no desempenho do modelo.

Se você ainda encontrar que a governança de risco do modelo está bloqueada por imparcialidade, sugerimos que continue usando a versão ou o conjunto de dados do mecanismo atual e entre em contato com o suporte para receber mais orientações.