Entender o escopo e a duração dos dados

A IA antilavagem de dinheiro é criada para avaliar o risco de lavagem de dinheiro linha de negócios. Um LoB está associado a um dos seus para clientes comerciais.

Ao criar um conjunto de dados para uso com um LoB, você precisará incluir vários tabelas. Cada tabela precisa abranger um período de tempo suficiente. Esta página oferece uma visão geral das tabelas necessárias e mostra como determinar o período que cada uma delas deve abranger.

Tabelas a serem usadas

O conjunto de dados do BigQuery usado com a IA de AML precisa conter as seguintes tabelas:

  • Parte: todas as partes relevantes para a linha de negócios em questão.
    • LoB de varejo: todos os clientes de varejo que tiveram contas em qualquer momento do período necessário
    • LoB comercial: todos os clientes de bancos comerciais (entidades jurídicas e físicas) que mantiveram contas em qualquer momento no período necessário
  • AccountPartyLink: histórico completo de quais contas foram por quais partes. Isso deve abranger todas as contas para produtos e serviços em que qualquer parte na tabela da Parte era o proprietário principal da conta em em qualquer ponto do período necessário.
  • Transação: todas as transações de contas no Tabela AccountPartyLink para o período necessário.
  • RiskCaseEvent: todos os eventos de caso de risco (consulte o tipo de evento) valores) para qualquer caso de risco e parte na tabela Party com um AML_PROCESS_START (início da investigação) no período necessário. Essa tabela pode incluir eventos com um horário anterior ou posterior ao intervalo de tempo necessário.
  • PartySupplementaryData: (se usado) para 0 a 100 valores exclusivos party_supplementary_data_id, incluem um histórico completo dos valores esses campos para todas as partes na tabela "Parte" no período necessário.

Como usar outros dados

Consulte Dados complementares se você tiver dados adicionais sobre partes (não abordado de outra forma no esquema) que seja relevante para a identificação de dinheiro o risco de lavagem de roupas.

Intervalo de tempo do conjunto de dados

O intervalo de tempo que qualquer tabela em um conjunto de dados deve cobrir pode ser calculado como segue para qualquer operação. Você vai precisar saber:

  • O horário de término. Esse é o horário mais recente a partir do qual os rótulos são usados e a partir do qual os dados são usados para gerar atributos para ajuste.
  • A versão do mecanismo (consulte a lista de versões do mecanismo) que você usará.
  • A operação que você vai realizar: ajustar, treinar, prever ou fazer testes retrospectivos.
  • Para operações de previsão ou backtest, o número de períodos para os quais você vai realizar a operação a ser especificado na chamada de API.

Entender a duração do escopo de dados

Primeiro, calcule o número de períodos que a operação vai usar. Esse é o número de meses consecutivos que terminam no último mês completo antes da hora de término especificada, para a qual a IA de AML vai avaliar os recursos do modelo.

  • Para operações de previsão e backtest, esse é o número de ou períodos de backtest especificados na chamada da API.
  • Para outras operações, isso depende da versão do mecanismo e da operação. Por exemplo, as versões do mecanismo v004.004 usam 18 períodos para ajuste e 15 para treinamento.

Em seguida, você deve trabalhar a janela de lookback para cada tabela. Este é o máximo número de meses de dados necessários dessa tabela para que a IA antilavagem de dinheiro possa calcular o modelo atributos para um determinado período.

  • Por exemplo, para Versões do Engine v004.004, são 13 meses para Transações e AccountPartyLink, 12 meses para a tabela RiskCaseEvent e 0 para tabelas Party e PartySupplementaryData.

O conjunto de dados precisa abranger o período de referência de todos os períodos usados pela operação escolhida. É possível calcular o número de meses completos do calendário dados anteriores ao horário de término que você precisará para uma determinada operação com o seguinte fórmula:

  • número de períodos + janela de lookback -1

Por exemplo, para versões do mecanismo v004.00X que conduzem ajustes, são necessários:

  • 18 + 13 - 1 = 30 meses de dados de Transaction e AccountPartyLink tabelas,
  • 18 + 12 - 1 = 29 meses de dados da tabela "Eventos de caso de risco", além de eventos mais recentes para casos de risco na tabela.
  • E 18 + 0 - 1 = 17 meses de dados do Party SupplementaryData tabelas.