Glossário da IA antilavagem de dinheiro

Este glossário define termos específicos para a IA de AML. Para informações gerais os termos de machine learning, consulte Glossário de machine learning.

A

ADC

Cada uma das bibliotecas de cliente da API oferece uma maneira de usar as credenciais padrão do aplicativo (ADC, na sigla em inglês) locais.

Para obter informações sobre a diferença entre suas credenciais do ADC local e as credenciais da CLI gcloud, consulte Credenciais da CLI gcloud e credenciais do ADC

B

backtesting (link em inglês)
O backtest usa dados históricos para avaliar o desempenho (recall observado) de um modelo comparando a pontuação de risco gerada com a resultados reais de investigações históricas.
resultados de backtest
Um recurso BacktestResult da IA antilavagem de dinheiro (também conhecido como "resultados de backtest") é criado para testar o desempenho de uma model em um dataset.
.
Para mais informações, consulte Avaliar um modelo.

C

dados bancários principais
Os
dados bancários principais incluem dados sobre partes, transações e detenções de contas. Ela ajuda a IA de AML a entender seus clientes e as atividades bancárias deles para detectar características e comportamentos de risco.
janela de tempo principal

A janela de tempo do núcleo se refere ao período usado em um modelo de IA antilavagem de dinheiro operacional (configuração do mecanismo, treinamento, backtesting e previsão) gerar treinamento, exemplos de avaliação ou saídas de modelo. Este período precisa ser coberto por todas as tabelas do conjunto de dados.

Diferentes operações de API têm requisitos diferentes para a janela de tempo principal para gerar recursos e rótulos. Para mais informações, consulte Noções básicas sobre o escopo e a duração dos dados.

Consulte também janela de lookback.

D

validação de dados
A IA AML realiza verificações de validação de dados ao criar um conjunto de dados, configuração do mecanismo, modelo, resultados de backtest ou de previsão. Se o o conjunto de dados especificado não passar na validação de dados, o recurso não será criados e erros de validação de dados são gerados (indicando a natureza da o problema).
Para mais informações, consulte Erros de validação de dados.
dataset

um recurso de conjunto de dados da IA antilavagem de dinheiro; (ou apenas "conjunto de dados") é usado para especificar os dados, de acordo com Modelo de dados de entrada da antilavagem de dinheiro, que pode ser usado na geração de um modelo, avaliar o desempenho de um modelo, gerar pontuações de risco e a explicabilidade por parte.

Para mais informações, consulte Entender o modelo de dados e os requisitos da AML.

E

horário de término

As operações de IA de AML que usam um conjunto de dados exigem que você especifique um horário de término. Este campo é usado para controlar quais meses do conjunto de dados são usados para gerar exemplos de treinamento ou avaliação e saídas de modelo.

O horário de término e todos os meses usados para uma operação precisam estar dentro do intervalo de datas do conjunto de dados associado.

Por exemplo, uma operação de treinamento exige uma janela de tempo principal de 15 meses. Se você usa um conjunto de dados com um período de 15 de outubro de 2021 a 21 de maio de 2023 e um horário de término em 12 de abril de 2023, e o treinamento vai usar exemplos da agenda de janeiro de 2022 a março de 2023, que está no período no conjunto de dados.

configuração do mecanismo

um recurso EngineConfig da IA antilavagem de dinheiro; (também conhecida como "configuração do mecanismo") especifica parâmetros na geração e avaliar um modelo de IA antilavagem de dinheiro e gerar pontuações de risco e explicabilidade.

Alguns desses parâmetros são especificados na chamada de API para criar um mecanismo como a versão do mecanismo e o volume de investigação esperado. Outra opção são gerados automaticamente pela IA antilavagem de dinheiro usando uma no conjunto de dados especificado, como hiperparâmetros ajustados.

Para mais informações, consulte Configurar um mecanismo.

versão do mecanismo

Um recurso EngineVersion da IA AML (também conhecido como "versão do mecanismo") define aspectos de como a IA AML detecta riscos, o que inclui ajuste, treinamento e avaliação do modelo, bem como o modelo de dados e as famílias de atributos gerais da AML.

Como configurar um mecanismo de IA antilavagem de dinheiro requer que você especifique uma versão do mecanismo a ser usada. A versão do mecanismo é usada para treinar e avaliar modelos com essa configuração e gerar pontuações de risco e explicabilidade.

A nomenclatura da versão do mecanismo é estruturada da seguinte maneira, com o tipo do mecanismo expressar a linha de negócios compatível e o subtipo de mecanismo, o ajuste; versão principal e versão secundária atualizada à medida que novos comportamentos são implementados.

Exemplos de versões incluem:

  • aml-retail.default.v004.000.202312-000
  • aml-commercial.default.v004.000.202312-000
Controle de versão do mecanismo

Para mais informações sobre como gerenciar versões do mecanismo, consulte Gerenciar versões do mecanismo.

avaliação

Consulte também backtesting.

explicabilidade

Os modelos de IA antilavagem de dinheiro são usados para identificar partes que exibem ou características com alto risco de lavagem de dinheiro. A explicabilidade indica quais comportamentos ou características contribuíram mais para uma pontuação de alto risco para uma determinada parte.

Para mais informações, consulte Entenda os resultados das previsões.

Consulte também previsão.

exportar metadados

Vários recursos de IA de AML armazenam informações adicionais relacionadas à performance e à qualidade dos dados, que podem ser acessadas usando a operação de metadados de exportação.

Para mais informações, consulte o modelo de dados de saída da AML.

F

família de recursos
Famílias de atributos são coleções de atributos relacionados de ML, uma categorização simples e compreensível para as pessoas e equipes internas de auditoria.

I

entidade imutável

A IA de AML precisa recriar visualizações dos dados em diferentes momentos para ajuste, treinamento e backtesting. Para alcançar a IA antilavagem de dinheiro diferencia entidades mutáveis (que podem mudar valores ao longo do tempo) e entidades imutáveis (que não mudam).

Por exemplo, uma entidade mutável pode ser o saldo da sua conta corrente, que pode mudar com o tempo. Já uma entidade imutável pode ser um evento, como sacar US$ 50 em 2 de julho de 2024 às 12h00min00s da sua conta corrente, que não muda, já que foi um instantâneo no tempo.

no modelo de dados de entrada antilavagem de dinheiro, tabelas que representam entidades imutáveis; não têm os campos validity_start_time e is_entity_deleted. Isso inclui a tabela RiskCaseEvent.

Para mais informações, consulte Noções básicas sobre como os dados mudam ao longo do tempo.

Consulte também entidade mutável.

instance

Um recurso de instância de IA antilavagem de dinheiro (AML, na sigla em inglês) (também conhecido como "instância") fica na raiz de todos os outros recursos de IA AML e precisa ser criado antes que você possa trabalhar com outros recursos de IA AML. Várias instâncias podem ser criadas na mesma região em um projeto.

Para mais informações, consulte Criar uma instância de IA de AML.

processo de investigação

Um processo de investigação abrange toda a investigação ou sequência de investigações acionadas por um alerta. O processo começa quando a primeira parte de uma investigação começa e termina quando não são esperados resultados durante a investigação.

Para mais informações, consulte Ciclo de vida de um caso de risco.

L

LOB
A linha de negócios (LOB) diferencia os bancos de varejo e comerciais clientes na IA antilavagem de dinheiro. Conjuntos de dados, versões do mecanismo e recursos de registro estiverem vinculadas a uma linha de negócios, varejo comercial.
janela de lookback

Além da janela de tempo principal, as operações de IA de AML exigem que os conjuntos de dados incluam uma janela de retorno para permitir a geração de recursos que rastreiam o comportamento ao longo do tempo.

Para mais informações, consulte Entenda o escopo e a duração dos dados.

LRO

Várias operações de IA antilavagem de dinheiro, incluindo configuração de mecanismos, treinamento, backtesting e previsão, inicie uma operação de longa duração. (LRO, na sigla em inglês).

Para mais informações, consulte Gerenciar operações de longa duração.

M

Ausência de dados

A métrica de ausência é calculada para todas as famílias de atributos ao criar o seguintes recursos da IA antilavagem de dinheiro: configuração do mecanismo, modelo, backtest e os resultados de previsão.

Essa métrica mostra a porcentagem de valores ausentes em todos os atributos de uma família de atributos. Uma mudança significativa na falta de qualquer família de recursos entre ajuste, treinamento, avaliação e previsão pode indicar inconsistência nos conjuntos de dados usados.

model

um recurso de modelo da IA antilavagem de dinheiro; (também conhecido como "modelo") representa um modelo treinado que pode ser usado para para gerar pontuações de risco e explicabilidade.

entidade mutável

A IA antilavagem de dinheiro precisa ser capaz de recriar visualizações dos dados diferentes momentos para ajuste, treinamento e backtesting. Para alcançar a IA antilavagem de dinheiro diferencia entidades mutáveis (que podem (valores alterados ao longo do tempo) e entidades imutáveis (que não mudam).

Por exemplo, uma entidade mutável pode ser o saldo da sua conta corrente, que pode mudar com o tempo. mas uma entidade imutável pode ser um evento, sacar US $50 da sua conta corrente em 2 de julho de 2024, às 12h, o que não muda, já que foi um snapshot no tempo.

No modelo de dados de entrada da AML, as tabelas que representam entidades mutáveis têm os campos validity_start_time e is_entity_deleted. Isso inclui Party, AccountPartyLink, Transaction e tabelas PartySupplementaryData.

Para mais informações, consulte Como os dados mudam ao longo do tempo.

Consulte também entidade imutável.

O

lembrete observado

A IA de AML mede a performance do modelo em dados históricos usando a métrica de recuperação observada.

Essa métrica mostra a proporção de partes positivas rotuladas (por exemplo, saídas de clientes) de um período selecionado que teria sido identificado durante um período de atividade suspeita como de alto risco, o modelo que está sendo avaliado.

P

party

No modelo de dados de entrada da AML, uma parte representa um cliente do banco. Uma parte pode ser uma pessoa física ou uma pessoa jurídica.

Para mais informações, consulte a tabela Partido.

Consulte também parte registrada.

previsão

A previsão usa um modelo para gerar pontuações de risco e explicabilidade, que podem ser usadas no processo de investigação de AML.

resultados da previsão

Um recurso PredictionResult de IA de AML (também conhecido como "resultados de previsão") é o resultado do uso de um modelo para criar previsões.

Para mais detalhes sobre como gerar e usar pontuações de risco e explicabilidade no seu processo de investigação, consulte as páginas da seção Gerar pontuações de risco e explicabilidade.

R

parte registrada
Antes que uma parte possa ser usada para criar resultados da previsão (por exemplo, pontuações de risco e explicabilidade no nível da parte), a parte precisa ser registrados para a linha de negócios correspondente.
caso de risco

Um caso de risco abrange um processo de investigação ou um grupo de pessoas processos de investigação diferentes.

Consulte a tabela RiskCaseEvent.

dados de investigação de risco

Os dados de investigação de risco são usados pela IA antilavagem de dinheiro para entender processo de investigação de risco e dos resultados e gerar rótulos de treinamento.

pontuação de risco

Os modelos de IA antilavagem de dinheiro são usados para identificar partes que apresentam comportamentos ou características com alto risco de lavagem de dinheiro. Isso é feito por meio de uma pontuação de risco.

As pontuações de risco variam de 0 a 1. Uma pontuação mais alta indica um risco maior. No entanto, pontuações de risco não devem ser interpretadas diretamente como uma probabilidade de dinheiro lavagem de roupas.

Para mais informações, consulte Entender as saídas de previsão.

tipologia de risco

A IA antilavagem de dinheiro pode identificar riscos de lavagem de dinheiro cinco principais tipologias de risco antilavagem de dinheiro relacionadas ao monitoramento de transações.

Com investigação suficiente e dados complementares da parte (confira as tabelas de dados complementares), a IA antilavagem de dinheiro pode abranger mais tipologias.

S

dados complementares

Dados complementares são dados adicionais, que vão além do que está contido nos dados bancários essenciais e dados de investigação de risco áreas do esquema da IA antilavagem de dinheiro, que são relevantes para a previsão o risco de lavagem de dinheiro.

Por exemplo, você pode identificar e adicionar um indicador de risco que ajude os modelos a prever melhor uma tipologia de risco que não está bem coberta.

É possível adicionar dados suplementares a um conjunto de dados usando a tabela PartySupplementaryData.

período de atividade suspeita

Um período de atividade suspeita é um período em que você acredita que uma parte investigada apresentou comportamento suspeito. Isso é usado na avaliação do modelo (por exemplo, a métrica de recuperação para resultados de backtest) para confirmar que os clientes de alto risco são identificados nos meses em que tiveram atividade suspeita.

Para mais informações, consulte Ciclo de vida de um caso de risco.

T

treinamento
A IA AML faz o treinamento como parte da criação de um modelo usando hiperparâmetros (consulte ajuste) de uma configuração de mecanismo especificada.
ajuste
O ajuste é a otimização dos hiperparâmetros do modelo. A IA de AML faz o ajuste como parte da criação de uma configuração do mecanismo.

V

Horário de início da validade

O horário de início da validade de uma entidade mutável é usado. pela IA antilavagem de dinheiro para gerar um panorama do que o banco conhecia em um determinado momento. Isso permite que a IA de AML treine com precisão modelos que podem ser reutilizados nos dados mais recentes (ou seja, o que é conhecido pelo banco) para produzir escores de risco de alta fidelidade.

O horário de início da validade de uma determinada linha representa o primeiro horário em que os dados nesta linha era conhecido pelo banco e correto.

Para mais informações, consulte Como os dados mudam ao longo do tempo.