Visão geral da preparação do modelo

Esta página mostra as etapas para preparar uma IA antilavagem de dinheiro caso você já tenha configurado uma instância e preparado os eventos conjuntos de dados.

Visão geral dos estágios

O processo de preparação de um modelo é abordado nos três estágios a seguir:

Depois que você concluir os estágios iniciais e o desempenho do modelo atender às suas necessidades, consulte as orientações nas seções Gerar pontuações de risco e explicabilidade e Prepare-se para o modelo e a governança de riscos.

Antes de começar

Antes de começar, você precisará do seguinte:

Requisitos do conjunto de dados

Para orientações detalhadas sobre o modelo e o esquema de dados, consulte as páginas em Preparar dados para a IA antilavagem de dinheiro. Nesta seção, abordamos como garantir que os conjuntos de dados usados no ajuste de motores, treinamento e avaliação funcionam bem juntos.

Intervalos de tempo do conjunto de dados

O intervalo de tempo mínimo de conjuntos de dados para cada operação é abordado em Entenda o escopo e a duração dos dados. Em resumo, é necessário uma janela de lookback de 0 a 24 meses, dependendo da tabela. em um período principal de pelo menos 18 meses para cobrir todas as operações com no mesmo conjunto de dados. Conjuntos de dados mais curtos podem ser usados para operações individuais; por exemplo, se estiver reutilizando uma configuração de mecanismo e não precisar sintonização.

Por exemplo, para ajuste de mecanismos, a tabela Transaction deve ser cobrir pelo menos 42 meses (18 meses de janela de tempo principal e 24 meses para o janela de lookback).

A configuração de um mecanismo, o treinamento e a avaliação (backtesting) podem ser concluídos com um único conjunto de dados. confira a imagem a seguir. Para garantir uma boa produção desempenho ao evitar o overfitting, você deve usar uma janela de tempo central (ou seja, a criação de resultados de backtest) desconexa e mais recente do que a janela de tempo principal do treinamento, ou seja, a criação de um modelo.

Períodos do conjunto de dados para ajuste, treinamento e backtesting

Consistência do conjunto de dados

Ao usar conjuntos de dados diferentes para ajuste, treinamento e avaliação do mecanismo de dados, torne os conjuntos de dados consistentes em quais campos são preenchidos e como eles estão preenchidos. Isso é importante para a estabilidade e o desempenho do modelo antilavagem de dinheiro.

Da mesma forma, para uma pontuação de risco de alta qualidade, a usado para criar resultados de previsão com um modelo deve ser consistente com conjunto de dados usado para treinar esse modelo.

Especificamente, verifique o seguinte:

  • A mesma lógica é usada para preencher todos os campos. Mudar a lógica usada preencher um campo pode introduzir desvio de atributos entre treinamento de modelo e previsão ou avaliação.
  • A mesma seleção de campos RECOMENDADOS é preenchida. Por exemplo: remover um campo que foi preenchido durante treinamento de modelo pode fazer com que em que o modelo depende para estar distorcido ou ausente durante a avaliação ou previsão.
  • A mesma lógica é usada para fornecer valores. Na PartySupplementaryData, a mesma lógica é usada para forneça valores para cada campo party_supplementary_data_id.

    • Usando os mesmos dados, mas com party_supplementary_data_id diferentes. faz com que o modelo use os dados incorretamente. Por exemplo, campo específico usa o ID 5 no na tabela PartySupplementaryData para um conjunto de dados, mas usa o ID 7 em outro conjunto de dados.
    • Como remover um valor party_supplementary_data_id de que um modelo depende podem ter efeitos imprevisíveis. Por exemplo, o ID 3 é usado na tabela PartySupplementaryData em um conjunto de dados, mas não omitido de outro conjunto de dados.

Agora você tem um conjunto de dados pronto para ajuste, treinamento e avaliação do mecanismo. Observação que as operações do modelo podem levar dezenas de horas. Para mais informações sobre como Verifique se uma operação ainda está em execução ou foi concluída (com falha ou bem-sucedida), ver Gerencie operações de longa duração.