Gere um modelo

Esta página aborda brevemente os conceitos por detrás da preparação de modelos. Um recurso de modelo de IA de AML representa um modelo preparado que pode ser usado para gerar pontuações de risco e capacidade de explicação.

Quando treinar ou voltar a treinar

A IA de AML prepara um modelo como parte da criação de um recurso de modelo. O modelo tem de ser preparado antes de poder ser avaliado (ou seja, testado retrospetivamente) ou usado para gerar resultados de previsão.

Para ter o melhor desempenho e manter os modelos mais atualizados, considere fazer a reciclagem mensalmente. No entanto, uma determinada versão do motor suporta a geração de resultados de previsão durante 12 meses a partir do lançamento de uma versão do motor secundária mais recente.

Como treinar

Para preparar um modelo (ou seja, criar um modelo), consulte o artigo Crie e faça a gestão de modelos.

Em particular, tem de selecionar o seguinte:

  • Os dados a usar para a preparação:

    Especifique um conjunto de dados e uma hora de fim dentro do intervalo de datas do conjunto de dados.

    O treino usa etiquetas e funcionalidades com base em meses do calendário completos até, mas não incluindo, o mês da hora de fim selecionada. Para mais informações, consulte Intervalos de tempo do conjunto de dados.

  • Uma configuração do motor criada com um conjunto de dados consistente:

    Consulte o artigo Configure um motor.

Resultado da preparação

A preparação gera um recurso de modelo, que pode ser usado para fazer o seguinte:

  • Crie resultados de testes retroativos, que são usados para avaliar o desempenho do modelo usando verdadeiros positivos atualmente conhecidos
  • Crie resultados de previsão, que são usados quando estiver pronto para começar a rever novos casos de potencial branqueamento de capitais

Os metadados do modelo contêm a métrica missingness, que pode ser usada para avaliar a consistência do conjunto de dados (por exemplo, comparando os valores de dados em falta de famílias de caraterísticas de diferentes operações)

Nome da métrica Descrição da métrica Exemplo de valor da métrica
Dados em falta

Percentagem de valores em falta em todas as funcionalidades de cada família de funcionalidades.

Idealmente, todas as famílias de funcionalidades de IA de AML devem ter uma Missingness próxima de 0. Podem ocorrer exceções em que os dados subjacentes dessas famílias de funcionalidades não estão disponíveis para integração.

Uma alteração significativa neste valor para qualquer família de funcionalidades entre a otimização, a preparação, a avaliação e a previsão pode indicar inconsistência nos conjuntos de dados usados.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Importância

Uma métrica que mostra a importância de uma família de funcionalidades para o modelo. Os valores mais elevados indicam uma utilização mais significativa da família de funcionalidades no modelo. Uma família de caraterísticas que não é usada no modelo tem importância zero.

Os valores de importância podem ser usados quando se dá prioridade à ação com base nos resultados da distorção familiar. Por exemplo, o mesmo valor de desvio para uma família com maior importância para o modelo é mais urgente de resolver.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Os metadados do modelo não contêm métricas de recall de um conjunto de testes. Para gerar medições de relembrança para um período específico (por exemplo, o conjunto de testes), consulte Avalie um modelo.