Visão geral
Nesta página, você encontra uma visão geral dos processos da IA antilavagem de dinheiro e aborda os principais conceitos. para os clientes entenderem. Ela é voltada principalmente para equipes que vão usar a IA de AML para treinar, testar e implantar modelos.
A IA AML permite que os bancos treinem, testem e implantem automaticamente modelos para detectar lavagem de dinheiro. Os guias de IA antilavagem de dinheiro são dividido em cinco seções de navegação à esquerda que correspondem às cinco etapas.
Etapa | Descrição |
---|---|
1. Configurar a AI antilavagem de dinheiro | Confira se o projeto do Google Cloud está pronto para usar a IA de AML. Ativar os serviços necessários do Google Cloud e configurar a geração de registros e as cotas. Crie uma ou mais instâncias de IA de AML. |
2. Preparar dados para a IA antilavagem de dinheiro | Analise o modelo de dados e o esquema. Priorize quais dados incluir. Colete e transforme os dados bancários principais, de investigação de risco e outros dados necessários. Criar e validar um conjunto de dados. |
3. Gerar um modelo e avaliar o desempenho | Entender os mecanismos, os modelos e os backtesting da IA antilavagem de dinheiro.
|
4. Gerar pontuações de risco e explicabilidade | Registre seus clientes bancários comerciais e de varejo. Use um modelo para
gerar pontuações de risco por parte e explicabilidade para:
|
5. Preparar-se para a governança de modelos e riscos | Combine as saídas de IA de AML de ajuste, treinamento, avaliação e previsão com a documentação de conceito e produto de AML para atender aos requisitos do processo de governança de risco do modelo. |
As principais operações técnicas da IA antilavagem de dinheiro para criar, testar e implantar modelos são os seguintes. Essas etapas são compatíveis com as etapas 2 a 4 na tabela anterior.
- Criar conjunto de dados da IA antilavagem de dinheiro: cria um conjunto estruturado de Tabelas de dados de entrada do BigQuery para a IA antilavagem de dinheiro
- Configuração do mecanismo: ajusta um mecanismo de IA antilavagem de dinheiro a um conjunto de dados de IA antilavagem de dinheiro, incluindo o ajuste de hiperparâmetros.
- Treinamento de modelo: treina um modelo de IA de AML usando uma configuração de motor e um conjunto de dados.
- Backtest: testa um modelo de IA de AML em relação a dados históricos em um conjunto de dados e resume a performance.
- Registrar partes: registra partes (clientes do banco que têm produtos bancários e enviam ou recebem transações) para que possam receber uma pontuação na previsão.
- Previsão: produz pontuações de partes e explicabilidade para uso na produção.
A configuração do mecanismo, o treinamento do modelo, o backtest do modelo e a previsão do modelo exigem um conjunto de dados de IA de AML como entrada e retornam os artefatos correspondentes, que são usados em outras operações. Por exemplo, Treinamento de modelo retorna uma referência a um modelo de IA antilavagem de dinheiro treinado que pode ser usado para backtest ou previsão. Para detalhes técnicos das operações, consulte a Visão geral de referência da REST.
Árvore de dependência de processos de IA antilavagem de dinheiro
Considerações importantes ao usar a IA de AML
Esta seção foi desenvolvida para apresentar aos clientes uma introdução aos principais conceitos da IA antilavagem de dinheiro e aconselhar sobre algumas práticas recomendadas. Os tópicos aqui são abordados com mais detalhes em guias dedicados, e links são fornecidos para leitura adicional.
Consistência de data
A IA antilavagem de dinheiro usa períodos distintos para diferentes operações. É preciso ter cuidado com as datas selecionadas para cada operação para garantir resultados confiáveis. Para evitar vieses nos resultados, é importante que os meses usados para treinar um modelo de IA antilavagem de dinheiro não se sobrepõem os meses usados para backtesting.
Como um conjunto de dados de IA de AML contém muitos meses de dados, os conjuntos de dados podem ser usados para várias operações, sujeitos a essas seleções de data corretas. O diagrama a seguir ilustra um ciclo de desenvolvimento usando a IA de AML, em que diferentes períodos de tempo em um único conjunto de dados que abrangem 42 meses são usados para configurar um mecanismo (ajuste de hiperparâmetro), treinamento e backtesting. Tudo esses processos usam janelas de lookback que fornecem contexto para o modelo e podem se sobreponham com segurança aos dados usados para outras operações.
Para mais informações sobre conjuntos de dados da IA antilavagem de dinheiro e janelas de tempo para diferentes operações, consulte Compreender o escopo e a duração dos dados.
Para registrar corretamente as alterações nos seus dados ao longo do tempo, consulte Alterações de dados ao longo do tempo.
Frequência do lote Production
Na previsão, a IA antilavagem de dinheiro produz pontuações de risco antilavagem de dinheiro por mês. Os clientes costumam usar a IA antilavagem de dinheiro como parte de um processo mensal em lote, e eles aconselhável executar previsões em meses com dados de transação completos, tanto sempre que possível.
Consistência de campo
Como em qualquer processo de machine learning, os dados devem ser os mais consistentes possível entre dados de treinamento e dados de teste. Se os campos não forem preenchidos de forma consistente, as mudanças podem causar resultados não confiáveis. É altamente recomendável que as etapas são tomadas para garantir que os campos sejam preenchidos consistentemente para cada operação em uma desenvolvimento, e isso é especialmente verdade se conjuntos de dados diferentes forem usados para cada operação. Para mais informações, consulte Consistência do conjunto de dados.
Configurações do mecanismo
Depois que uma configuração de mecanismo é criada, normalmente não é necessário recriá-la. para cada novo conjunto de dados ou ciclo de desenvolvimento. Os hiperparâmetros escolhidos em uma configuração de mecanismo para um conjunto de dados geralmente têm bom desempenho em conjuntos de dados semelhantes.
Os ciclos de desenvolvimento iterativo estão ilustrados no diagrama a seguir, enquanto o diagrama anterior usa um único conjunto de dados para o treinamento de modelo e o backtest as operações.
Para mais informações, consulte Quando ajustar ou herdar.
Linhagem de dados
A maioria das políticas de governança do modelo define um requisito para rastrear a linhagem de dados usada em todas as operações de ML, desde a configuração do mecanismo, o treinamento, a avaliação previsão. Os clientes são responsáveis por rastrear essa linhagem de dados.
Recomendamos o uso de um identificador exclusivo nos nomes de todos os dados de entrada, recursos de IA de AML e dados de saída para rastrear a linhagem em todos os estágios. Isso ajuda a garantir uma vinculação forte entre os recursos em uma execução específica. Os clientes também podem rotular todos os recursos de IA de AML para atender aos requisitos de linhagem.
Além disso, recomendamos o uso de snapshots do BigQuery em solicitações de API para garantir uma linhagem de dados precisa.
Essa configuração ajuda a responder a perguntas como "De onde veio essa configuração do mecanismo?" e "De onde veio esse modelo?", além de ajudar a investigar e resolver incidentes.
Para mais detalhes sobre como criar e gerenciar recursos da IA antilavagem de dinheiro, consulte o REST API.