Entender o escopo e a duração dos dados

A IA antilavagem de dinheiro é configurada para avaliar o risco de lavagem de dinheiro em uma linha de negócios. Uma LoB é associada a um dos seus clientes comerciais ou de varejo.

Ao criar um conjunto de dados a ser usado com uma linha de base, primeiro é preciso determinar o período que o conjunto de dados vai cobrir.

Intervalo de tempo do conjunto de dados

O período é composto por três partes:

Gráfico de requisitos de dados históricos

  • Janela de tempo do núcleo: esse período precisa ser coberto por todas as tabelas no conjunto de dados. Diferentes operações da API têm requisitos distintos de janela de tempo principal para gerar atributos e rótulos:

    • Como criar uma configuração de mecanismo (para ajuste): mínimo de 18 meses
    • Como criar um modelo (para treinamento): mínimo de 15 meses
    • Criando resultados de previsão (para pontuação): mínimo de 1 mês
    • Criar resultados de backtest (para backtesting ou avaliação de modelo): mínimo de três meses, inclua mais meses para ter uma avaliação mais precisa.

  • Janela de lookback: são necessários 24 meses de dados extras antes da janela de tempo do núcleo para oferecer suporte a recursos do modelo que rastreiam a atividade ao longo do tempo. Os requisitos mínimos da janela de lookback variam de acordo com a tabela.

  • Eventos adicionais de caso de risco: dados sobre casos de risco mais recentes do que o horário de término do conjunto de dados podem ser incluídos para ter rótulos mais completos para treinamento e avaliação de modelos.

Por exemplo, é preciso criar uma configuração de mecanismo para usar o restante da IA antilavagem de dinheiro. Crie um conjunto de dados que abranja pelo menos 42 meses de dados de transação (18 meses da janela de tempo principal e 24 meses da janela de lookback).

Tabelas a serem usadas

Para uma determinada janela de tempo de núcleos e LoB, o conjunto de dados do BigQuery usado com a IA antilavagem de dinheiro precisa conter as seguintes tabelas:

  • Partido: todas as partes relevantes para essa linha de negócios durante toda a janela de tempo do núcleo. Nenhuma janela de lookback é necessária
    • LoB de varejo: todos os clientes de bancos de varejo que têm contas em qualquer momento no período principal.
    • LoB comercial: todos os clientes de bancos comerciais (pessoas jurídicas e naturais) que manteram contas em qualquer momento no período principal.
  • AccountPartyLink: histórico completo de quais contas foram mantidas por quais partes durante toda a janela de tempo principal, bem como uma janela de lookback de 24 meses. Isso deve abranger todas as contas de produtos e serviços quando uma parte na tabela Party é (ou era) o principal proprietário da conta
  • Transação: todas as transações de contas na tabela AccountPartyLink para toda a janela de tempo principal, bem como a janela de lookback de 24 meses.
  • RiskCaseEvent: todos os eventos de caso de risco (consulte os valores de evento type) de qualquer caso de risco e parte na tabela Partido com um AML_PROCESS_START (início da investigação) na janela de tempo principal e uma janela de lookback mínima de 12 meses. Alguns desses eventos podem ter um horário anterior ou posterior à janela de tempo principal e à janela de lookback.
  • PartySupplementaryData: (se usado) para 0 a 100 valores party_supplementary_data_id exclusivos, inclua um histórico completo dos valores desses campos para todas as partes na tabela Party para a janela de tempo principal. Nenhuma janela de lookback é necessária.

Usar dados adicionais

Consulte Dados complementares se tiver dados adicionais sobre as partes (não cobertos no esquema) que sejam relevantes para identificar riscos de lavagem de dinheiro.