Nesta página, abordaremos brevemente os conceitos por trás do treinamento de modelo.
Quando treinar ou retreinar
A IA antilavagem de dinheiro treina um modelo como parte da criação de um recurso Model. O modelo precisa ser treinado antes de ser avaliado (ou seja, testado de forma retroativa) ou usado para gerar resultados de previsão.
Para ter o melhor desempenho e manter os modelos mais atualizados, considere o retreinamento mensal. No entanto, uma determinada versão do mecanismo é compatível com a geração de resultados de previsão por 12 meses a partir do lançamento de uma versão secundária mais recente do mecanismo.
Como treinar
Para treinar um modelo (ou seja, criar um modelo), consulte Criar e gerenciar modelos.
Especificamente, você precisa selecionar o seguinte:
Os dados a serem usados para treinamento:
Especifique um conjunto de dados e um horário de término dentro do período do conjunto de dados.
O treinamento usa rótulos e recursos com base em meses completos até o mês do horário de término selecionado, mas sem incluir essa informação. Para mais informações, consulte Intervalos de tempo do conjunto de dados.
Uma configuração de mecanismo criada usando um conjunto de dados consistente:
Consulte Configurar um mecanismo.
Saída de treinamento
O treinamento gera um recurso Model, que pode ser usado para fazer o seguinte:
- Criar resultados de backtest, que são usados para avaliar o desempenho do modelo usando verdadeiros positivos conhecidos atualmente
- Criar resultados de previsão, que serão usados quando você estiver pronto para começar a analisar novos casos de possível lavagem de dinheiro
Os metadados do modelo contêm a métrica a seguir. Especificamente, essa métrica mostra todas as grandes mudanças em que as famílias de atributos são compatíveis com o conjunto de dados (entre ajuste de mecanismo, treinamento, avaliação e previsão).
Nome da métrica | Descrição da métrica | Exemplo de valor de métrica |
---|---|---|
Falta |
Parcela de valores ausentes em todos os atributos em cada família de atributos. O ideal é que todas as famílias de recursos de IA antilavagem de dinheiro tenham um valor ausente próximo de 0. Podem ocorrer exceções quando os dados subjacentes a essas famílias de recursos não estiverem disponíveis para integração. Uma alteração significativa nesse valor para qualquer família de atributos entre o ajuste, o treinamento, a avaliação e a previsão pode indicar inconsistência nos conjuntos de dados usados. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Importância |
Uma métrica que mostra a importância de uma família de atributos para o modelo. Valores mais altos indicam um uso mais significativo da família de atributos no modelo. Uma família de atributos que não é usada no modelo tem importância zero. Os valores de importância podem ser usados ao priorizar ações quanto aos resultados de distorção da família. Por exemplo, a resolução do mesmo valor de distorção em uma família com maior importância para o modelo é mais urgente. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
Os metadados do modelo não contêm métricas de recuperação de um conjunto de teste. Para gerar medições de recall para um período específico (por exemplo, o conjunto de teste), consulte Avaliar um modelo.