Entender o escopo e a duração dos dados

A IA antilavagem de dinheiro é configurada para avaliar o risco de lavagem de dinheiro de uma linha de negócios. Um LoB está associado a um dos seus clientes de varejo ou comercial.

Ao criar um conjunto de dados para uso com um LoB, é necessário incluir várias tabelas. Cada tabela precisa abranger um período de tempo suficiente. Esta página oferece uma visão geral das tabelas necessárias e mostra como determinar o período que cada uma delas precisa abranger.

Tabelas a serem usadas

O conjunto de dados do BigQuery usado com a IA de AML precisa conter as seguintes tabelas:

  • Parte: todas as partes relevantes para a LoB
    • LoB de varejo: todos os clientes de varejo que tiveram contas em qualquer momento do período necessário
    • LoB comercial: todos os clientes de bancos comerciais (entidades jurídicas e físicas) que mantiveram contas em qualquer momento no período necessário
  • AccountPartyLink: histórico completo das contas que foram detidas por quais partes. Isso deve abranger todas as contas de produtos e serviços quando qualquer parte na tabela "Parte" for o titular da conta principal em qualquer momento no período necessário.
  • Transação: todas as transações de contas na tabela AccountPartyLink para o período necessário.
  • RiskCaseEvent: todos os eventos de caso de risco (consulte os valores do tipo de evento) para qualquer caso de risco e parte na tabela "Parte" com um AML_PROCESS_START (início da investigação) no período necessário. Essa tabela pode incluir eventos com um horário anterior ou posterior ao intervalo de tempo necessário.
  • PartySupplementaryData: (se usado) para 0 a 100 valores exclusivos de party_supplementary_data_id, inclua um histórico completo dos valores desses campos para todas as partes na tabela "Parties" no período necessário.

Como usar outros dados

Consulte Dados complementares se você tiver dados adicionais sobre partes (não cobertos pelo esquema) que sejam relevantes para identificar o risco de lavagem de dinheiro.

Intervalo de tempo do conjunto de dados

O período que qualquer tabela em um conjunto de dados precisa abranger pode ser calculado da seguinte forma para qualquer operação. Você vai precisar saber:

  • O horário de término. É o horário mais recente em que os rótulos são usados e os dados são usados para gerar recursos de ajuste.
  • A versão do mecanismo (consulte a lista de versões do mecanismo) que você vai usar.
  • A operação que você vai realizar: ajustar, treinar, prever ou fazer testes retrospectivos.
  • Para operações de previsão ou backtest, o número de períodos em que você vai realizar a operação, que será especificado na chamada da API.

Entender a duração do escopo de dados

Primeiro, calcule o número de períodos que a operação vai usar. Esse é o número de meses consecutivos que terminam no último mês completo antes da hora de término especificada, para a qual a IA de AML vai avaliar os recursos do modelo.

  • Para operações de previsão e backtest, esse é o número de períodos de previsão ou de backtest especificados na chamada de API.
  • Para outras operações, isso depende da versão do mecanismo e da operação. Por exemplo, as versões do mecanismo v004.004 usam 18 períodos para ajuste e 15 para treinamento.

Em seguida, calcule a janela de lookback para cada tabela. Esse é o número máximo de meses de dados necessários dessa tabela para que a IA de AML calcule os recursos do modelo em um determinado período.

  • Por exemplo, para as versões do mecanismo v004.004, são 13 meses para as tabelas Transaction e AccountPartyLink, 12 meses para a tabela RiskCaseEvent e 0 mês para as tabelas Party e PartySupplementaryData.

O conjunto de dados precisa abranger o período de referência de todos os períodos usados pela operação escolhida. Você pode calcular o número de meses completos de dados antes do horário de término que vai precisar para uma determinada operação com a seguinte fórmula:

  • número de períodos + janela de lookback -1

Por exemplo, para as versões do mecanismo v004.00X que fazem o ajuste, você precisa de:

  • 18 + 13 - 1 = 30 meses de dados das tabelas Transaction e AccountPartyLink.
  • 18 + 12 - 1 = 29 meses de dados da tabela "Eventos de caso de risco", além de eventos mais recentes para casos de risco na tabela.
  • E 18 + 0 - 1 = 17 meses de dados das tabelas Party e PartySupplementaryData.