Gere um modelo

Nesta página, abordaremos brevemente os conceitos por trás do treinamento de modelo.

Quando treinar ou retreinar

A IA antilavagem de dinheiro treina um modelo como parte da criação de um recurso Model. O modelo precisa ser treinado antes de ser avaliado (ou seja, testado de forma retroativa) ou usado para gerar resultados de previsão.

Para ter o melhor desempenho e manter os modelos mais atualizados, considere o retreinamento mensal. No entanto, uma determinada versão do mecanismo é compatível com a geração de resultados de previsão por 12 meses a partir do lançamento de uma versão secundária mais recente do mecanismo.

Como treinar

Para treinar um modelo (ou seja, criar um modelo), consulte Criar e gerenciar modelos.

Especificamente, você precisa selecionar o seguinte:

  • Os dados a serem usados para treinamento:

    Especifique um conjunto de dados e um horário de término dentro do período do conjunto de dados.

    O treinamento usa rótulos e recursos com base em meses completos até o mês do horário de término selecionado, mas sem incluir essa informação. Para mais informações, consulte Intervalos de tempo do conjunto de dados.

  • Uma configuração de mecanismo criada usando um conjunto de dados consistente:

    Consulte Configurar um mecanismo.

Saída de treinamento

O treinamento gera um recurso Model, que pode ser usado para fazer o seguinte:

  • Criar resultados de backtest, que são usados para avaliar o desempenho do modelo usando verdadeiros positivos conhecidos atualmente
  • Criar resultados de previsão, que serão usados quando você estiver pronto para começar a analisar novos casos de possível lavagem de dinheiro

Os metadados do modelo contêm a métrica a seguir. Especificamente, essa métrica mostra todas as grandes mudanças em que as famílias de atributos são compatíveis com o conjunto de dados (entre ajuste de mecanismo, treinamento, avaliação e previsão).

Nome da métrica Descrição da métrica Exemplo de valor de métrica
Falta

Parcela de valores ausentes em todos os atributos em cada família de atributos.

O ideal é que todas as famílias de recursos de IA antilavagem de dinheiro tenham um valor ausente próximo de 0. Podem ocorrer exceções quando os dados subjacentes a essas famílias de recursos não estiverem disponíveis para integração.

Uma alteração significativa nesse valor para qualquer família de atributos entre o ajuste, o treinamento, a avaliação e a previsão pode indicar inconsistência nos conjuntos de dados usados.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Importância

Uma métrica que mostra a importância de uma família de atributos para o modelo. Valores mais altos indicam um uso mais significativo da família de atributos no modelo. Uma família de atributos que não é usada no modelo tem importância zero.

Os valores de importância podem ser usados ao priorizar ações quanto aos resultados de distorção da família. Por exemplo, a resolução do mesmo valor de distorção em uma família com maior importância para o modelo é mais urgente.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Os metadados do modelo não contêm métricas de recuperação de um conjunto de teste. Para gerar medições de recall para um período específico (por exemplo, o conjunto de teste), consulte Avaliar um modelo.