Esta página aborda brevemente os conceitos por trás do treinamento de modelo. Um recurso de modelo de IA de AML representa um modelo treinado que pode ser usado para gerar pontuações de risco e explicabilidade.
Quando treinar ou treinar novamente
A IA de AML treina um modelo como parte da criação de um recurso de modelo. O modelo precisa ser treinado antes de ser avaliado (ou seja, testado anteriormente) ou usado para gerar resultados de previsão.
Para ter a melhor performance e manter os modelos mais atualizados, considere o treinamento mensal. No entanto, uma determinada versão do mecanismo oferece suporte à geração de resultados de previsão por 12 meses a partir do lançamento de uma versão secundária mais recente do mecanismo.
Como treinar
Para treinar um modelo, consulte Criar e gerenciar modelos.
Mais especificamente, você precisa selecionar o seguinte:
Os dados a serem usados para treinamento:
Especifique um conjunto de dados e um horário de término dentro do período do conjunto de dados.
O treinamento usa rótulos e recursos com base em meses completos até o mês da data de término selecionada, mas não incluindo ela. Para mais informações, consulte Intervalos de tempo do conjunto de dados.
Uma configuração do mecanismo criada usando um conjunto de dados consistente:
Consulte Configurar um mecanismo.
Saída de treinamento
O treinamento gera um recurso de modelo, que pode ser usado para fazer o seguinte:
- Criar resultados de backtest, que são usados para avaliar a performance do modelo usando verdadeiros positivos conhecidos.
- Crie resultados de previsão, que são usados quando você está pronto para começar a analisar novos casos em busca de possíveis casos de lavagem de dinheiro.
Os metadados do modelo contêm a métrica missingness
, que pode ser usada para avaliar a consistência do conjunto de dados, por exemplo, comparando os valores de ausência de famílias de recursos de diferentes operações.
Nome da métrica | Descrição da métrica | Exemplo de valor da métrica |
---|---|---|
Ausência |
Porcentagem de valores ausentes em todos os atributos em cada família de atributos. O ideal é que todas as famílias de recursos de IA de AML tenham uma falta próxima de 0. Exceções podem ocorrer quando os dados subjacentes dessas famílias de recursos não estão disponíveis para integração. Uma mudança significativa nesse valor para qualquer família de recursos entre o ajuste, o treinamento, a avaliação e a previsão pode indicar inconsistência nos conjuntos de dados usados. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Importância |
Uma métrica que mostra a importância de uma família de recursos para o modelo. Valores mais altos indicam um uso mais significativo da família de recursos no modelo. Uma família de recursos que não é usada no modelo tem importância zero. Os valores de importância podem ser usados ao priorizar a ação em resultados de distorção familiar. Por exemplo, o mesmo valor de distorção para uma família com maior importância para o modelo é mais urgente de resolver. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
Os metadados do modelo não contêm métricas de recuperação de um conjunto de teste. Para gerar medições de recuperação de um período específico (por exemplo, o conjunto de testes), consulte Avaliar um modelo.