Visão geral do processo

Visão geral

Esta página oferece uma visão geral dos processos de IA de AML e aborda os principais conceitos para que os clientes entendam. Ela é voltada principalmente para equipes que vão usar a IA de AML para treinar, testar e implantar modelos.

A IA AML permite que os bancos treinem, testem e implantem automaticamente modelos para detectar lavagem de dinheiro. Os guias de IA de AML são divididos em cinco seções de navegação à esquerda que correspondem às cinco etapas a seguir.

EtapaDescrição
1. Configurar a AI antilavagem de dinheiro Confira se o projeto do Google Cloud está pronto para usar a IA de AML. Ative os serviços necessários do Google Cloud e configure o registro e as cotas. Crie uma ou mais instâncias de IA de AML.
2. Preparar dados para a IA antilavagem de dinheiro Revise o modelo de dados e o esquema. Priorize quais dados incluir. Colete e transforme os dados bancários principais, de investigação de risco e outros dados necessários. Crie e valide um conjunto de dados.
3. Gerar um modelo e avaliar a performance Entenda os mecanismos, modelos e testes retrospectivos de IA de AML.
  1. Configurar um mecanismo
  2. Treinar um modelo
  3. Avaliar o desempenho de um modelo
4. Gerar pontuações de risco e explicabilidade Registre seus clientes de varejo e bancários comerciais. Use um modelo para gerar pontuações de risco por parte e explicabilidade para:
  • Análise e testes para governança de riscos
  • Uso em pré-produção e produção
5. Preparar-se para a governança de modelos e riscos Combine as saídas de IA de AML de ajuste, treinamento, avaliação e previsão com a documentação de conceito e produto de AML para atender aos requisitos do processo de governança de risco do modelo.

As principais operações técnicas de IA de AML para criar, testar e implantar modelos são as seguintes. Essas etapas são compatíveis com as etapas 2 a 4 na tabela anterior.

  1. Criar conjunto de dados de IA antilavagem de dinheiro: cria um conjunto estruturado de tabelas de dados de entrada do BigQuery para a IA antilavagem de dinheiro.
  2. Configuração do mecanismo: ajusta um mecanismo de IA antilavagem de dinheiro a um conjunto de dados de IA antilavagem de dinheiro, incluindo o ajuste de hiperparâmetros.
  3. Treinamento de modelo: treina um modelo de IA de AML usando uma configuração de motor e um conjunto de dados.
  4. Backtest: testa um modelo de IA de AML em relação a dados históricos em um conjunto de dados e resume a performance.
  5. Registrar partes: registra partes (clientes do banco que têm produtos bancários e enviam ou recebem transações) para que possam receber uma pontuação na previsão.
  6. Previsão: produz pontuações de partes e explicabilidade para uso na produção.

A configuração do mecanismo, o treinamento do modelo, o backtest do modelo e a previsão do modelo exigem um conjunto de dados de IA de AML como entrada e retornam artefatos correspondentes que são usados em outras operações. Por exemplo, Treinamento de modelo retorna uma referência a um modelo de IA de AML treinado, que pode ser usado para backtest ou previsão. Para detalhes técnicos das operações, consulte a Visão geral de referência da REST.

Árvore de dependência para processos de IA de AML

Árvore de dependência para processos de IA de AML

Considerações importantes ao usar a IA de AML

Esta seção foi criada para apresentar aos clientes os principais conceitos da IA de AML e dar conselhos sobre algumas práticas recomendadas. Os tópicos aqui são abordados com mais detalhes em guias dedicados, e links são fornecidos para leitura adicional.

Consistência de data

A IA de AML usa períodos diferentes para operações diferentes. É preciso ter cuidado com as datas selecionadas para cada operação para garantir resultados confiáveis. Em particular, para evitar viés nos resultados, é importante que os meses usados para treinar um modelo de IA de AML não se sobreponham aos meses usados para backtesting.

Como um conjunto de dados de IA de AML contém muitos meses de dados, os conjuntos de dados podem ser usados para várias operações, sujeitos a essas seleções de data corretas. O diagrama a seguir ilustra um ciclo de desenvolvimento usando a IA de AML, em que diferentes períodos de tempo em um único conjunto de dados que abrangem 42 meses são usados para configurar um mecanismo (ajuste de hiperparâmetro), treinamento e backtesting. Todos esses processos usam janelas de lookback que fornecem contexto ao modelo e podem se sobrepor com segurança aos dados usados para outras operações.

Para mais informações sobre conjuntos de dados de IA de AML e janelas de tempo para diferentes operações, consulte Noções básicas sobre o escopo e a duração dos dados.

Para registrar as mudanças nos dados corretamente, consulte Mudanças nos dados ao longo do tempo.

Criar um conjunto de dados de IA antilavagem de dinheiro: etapas 1 a 4

Frequência do lote Production

Na previsão, a IA de AML produz pontuações de risco de AML por mês. Os clientes geralmente usam a IA de AML como parte de um processo mensal em lote e são aconselhados a executar previsões em meses com dados de transação completos, sempre que possível.

Consistência de campo

Como em qualquer processo de aprendizado de máquina, os dados precisam ser o mais consistentes possível entre os dados de treinamento e de teste. Se os campos não forem preenchidos de forma consistente, as mudanças podem causar resultados não confiáveis. É altamente recomendável que medidas sejam tomadas para garantir que os campos sejam preenchidos de forma consistente para cada operação em um ciclo de desenvolvimento, especialmente se diferentes conjuntos de dados forem usados para cada operação. Para mais informações, consulte Consistência do conjunto de dados.

Configurações do mecanismo

Depois que uma configuração do mecanismo é criada, normalmente não é necessário recriar essa configuração para cada novo conjunto de dados ou em cada ciclo de desenvolvimento. Os hiperparâmetros escolhidos em uma configuração de mecanismo para um conjunto de dados geralmente têm bom desempenho em conjuntos de dados semelhantes.

Os ciclos de desenvolvimento iterativos são ilustrados no diagrama a seguir, enquanto o diagrama anterior usa um único conjunto de dados para as operações de treinamento de modelo e backtest.

Para mais informações, consulte Quando ajustar ou herdar.

Criar um conjunto de dados de AI antilavagem de dinheiro: etapas 3 a 4

Linhagem de dados

A maioria das políticas de governança de modelos define um requisito para rastrear a linhagem de dados usada em todas as operações de ML, desde a configuração do mecanismo, treinamento, avaliação e previsão. Os clientes são responsáveis por rastrear a linhagem de dados.

Recomendamos o uso de um identificador exclusivo nos nomes de todos os dados de entrada, recursos de IA de AML e dados de saída para rastrear a linhagem em todos os estágios. Isso ajuda a garantir uma vinculação forte entre os recursos em uma execução específica. Os clientes também podem rotular todos os recursos de IA de AML para atender aos requisitos de linhagem.

Além disso, recomendamos o uso de snapshots do BigQuery em solicitações de API para garantir a linhagem de dados precisa.

Essa configuração ajuda a responder a perguntas como "De onde veio essa configuração do mecanismo?" e "De onde veio esse modelo?", além de ajudar a investigar e resolver incidentes.

Para saber como criar e gerenciar recursos de IA de AML, consulte as páginas da API REST.

Criar um conjunto de dados de AI antilavagem de dinheiro: etapas 3 a 4