Este glossário define termos específicos da IA de AML. Para termos gerais de machine learning, consulte o Glossário de machine learning.
A
- ADC
Cada uma das bibliotecas de cliente da API oferece uma maneira de usar credenciais padrão do aplicativo (ADC, na sigla em inglês) locais.
Para saber mais sobre a diferença entre as credenciais locais da ADC e as credenciais da CLI gcloud, consulte Credenciais da CLI gcloud e credenciais do ADC.
B
- backtesting
- O backtesting usa dados históricos para avaliar a performance (recall observado) de um modelo comparando a pontuação de risco gerada com os resultados reais das investigações históricas.
- resultados do backtest
- Um recurso BacktestResult de IA de AML (também conhecido como "resultados de backtest") é criado para testar o desempenho de um modelo em um conjunto de dados.
- Para mais informações, consulte Como avaliar um modelo.
C
- dados bancários principais Os
- dados bancários principais incluem dados sobre partes, transações e detenções de contas. Ela ajuda a IA de AML a entender seus clientes e as atividades bancárias deles para detectar características e comportamentos de risco.
- janela de tempo principal
A janela de tempo principal se refere ao período usado em uma operação de IA de AML (configuração do mecanismo, treinamento, backtesting e previsão) para gerar exemplos de treinamento, avaliação ou saídas de modelo. Esse período precisa ser coberto por todas as tabelas no conjunto de dados.
Diferentes operações de API têm requisitos diferentes para a janela de tempo principal para gerar recursos e rótulos. Para mais informações, consulte Noções básicas sobre o escopo e a duração dos dados.
Consulte também janela de lookback.
D
- Validação de dados
- A IA AML realiza verificações de validação de dados ao criar um conjunto de dados, configuração do mecanismo, modelo, resultados de backtest ou de previsão. Se o conjunto de dados especificado não passar na validação de dados, o recurso não será criado e erros de validação de dados serão produzidos, indicando a natureza do problema.
- Para mais informações, consulte Erros de validação de dados.
- conjunto de dados
Um recurso de conjunto de dados de IA de AML (ou apenas "conjunto de dados") é usado para especificar dados, conforme o modelo de dados de entrada da AML, que pode ser usado na geração de um modelo, na avaliação do desempenho de um modelo e na geração de pontuações de risco e explicabilidade por parte.
Para mais informações, consulte Entender o modelo de dados e os requisitos da AML.
E
- horário de término
As operações de IA de AML que usam um conjunto de dados exigem que você especifique um horário de término. Esse campo é usado para controlar quais meses no conjunto de dados são usados para gerar exemplos de treinamento ou avaliação e saídas de modelo.
O horário de término e todos os meses usados para uma operação precisam estar dentro do intervalo de datas do conjunto de dados associado.
Por exemplo, uma operação de treinamento exige uma janela de tempo principal de 15 meses. Se você usar um conjunto de dados com um período de 15 de outubro de 2021 a 21 de maio de 2023 e um horário de término em 12 de abril de 2023, o treinamento vai usar exemplos dos meses de janeiro de 2022 a março de 2023, que estão no período do conjunto de dados.
- engine config
Um recurso EngineConfig de IA de AML (também conhecido como "engine config") especifica parâmetros para gerar e avaliar um modelo de IA de AML e para gerar pontuações de risco e explicabilidade.
Alguns desses parâmetros são especificados na chamada de API para criar uma configuração do mecanismo, como a versão do mecanismo e o volume de investigação esperado. Outros parâmetros são gerados automaticamente pela IA de AML usando um conjunto de dados especificado, por exemplo, hiperparâmetros ajustados.
Para mais informações, consulte Configurar um mecanismo.
- versão do mecanismo
Um recurso EngineVersion da IA AML (também conhecido como "versão do mecanismo") define aspectos de como a IA AML detecta riscos, o que inclui ajuste, treinamento e avaliação do modelo, bem como o modelo de dados geral da AML e as famílias de atributos.
Para configurar um mecanismo de IA de AML, é necessário especificar uma versão do mecanismo a ser usada. A versão do mecanismo é usada para treinar e avaliar modelos com essa configuração e gerar pontuações de risco e explicabilidade.
A nomenclatura da versão do mecanismo é estruturada da seguinte maneira, com o tipo de mecanismo expressando a linha de negócios com suporte e o subtipo, o ajuste, a versão principal e a versão secundária atualizados conforme novos comportamentos são implementados.
Exemplos de versões incluem:
aml-retail.default.v004.000.202312-000
aml-commercial.default.v004.000.202312-000
Para mais informações sobre como gerenciar versões do mecanismo, consulte Gerenciar versões do mecanismo.
- avaliação
Consulte também backtesting.
- explicabilidade
Os modelos de IA antilavagem de dinheiro são usados para identificar partes que apresentam comportamentos ou características com alto risco de lavagem de dinheiro. A explicabilidade indica quais comportamentos ou características contribuíram mais para uma pontuação de alto risco para uma determinada parte.
Para mais informações, consulte Entender as saídas de previsão.
Consulte também previsão.
- exportar metadados
Vários recursos de IA de AML armazenam informações adicionais relacionadas à performance e à qualidade dos dados, que podem ser acessadas usando a operação de metadados de exportação.
Para mais informações, consulte o modelo de dados de saída da AML.
F
- família de recursos
- As famílias de recursos são coleções de recursos de ML relacionados, oferecendo uma categorização simples e compreensível para informar investigadores e equipes de auditoria interna.
I
- entidade imutável
A IA de AML precisa recriar visualizações dos dados em diferentes momentos para ajuste, treinamento e backtesting. Para fazer isso, a IA de AML diferencia entidades mutáveis (que podem mudar de valor ao longo do tempo) e imutáveis (que não mudam).
Por exemplo, uma entidade mutável pode ser o saldo da sua conta corrente, que pode mudar com o tempo. Já uma entidade imutável pode ser um evento, como sacar US $50 em 2 de julho de 2024 às 12h00min00s da sua conta corrente, que não muda, já que foi um instantâneo no tempo.
No modelo de dados de entrada da AML, as tabelas que representam entidades imutáveis não têm os campos
validity_start_time
eis_entity_deleted
. Isso inclui a tabela RiskCaseEvent.Para mais informações, consulte Como os dados mudam ao longo do tempo.
Consulte também entidade mutável.
- instance
Um recurso de instância de IA antilavagem de dinheiro (AML, na sigla em inglês) (também conhecido como "instância") fica na raiz de todos os outros recursos de IA AML e precisa ser criado antes que você possa trabalhar com outros recursos de IA AML. Várias instâncias podem ser criadas na mesma região em um projeto.
Para mais informações, consulte Criar uma instância de IA de AML.
- processo de investigação
Um processo de investigação abrange toda a investigação ou sequência de investigações acionadas por um alerta. O processo começa quando a primeira parte de uma investigação começa e termina quando não há mais resultados esperados dessa investigação.
Para mais informações, consulte Ciclo de vida de um caso de risco.
L
- LOB
- A linha de negócios (LOB) distingue clientes de bancos comerciais e de varejo na IA de AML. Os conjuntos de dados, as versões do mecanismo e o registro de partes são vinculados a uma linha de negócios, varejo ou comercial específica.
- janela de lookback
Além da janela de tempo principal, as operações de IA de AML exigem que os conjuntos de dados incluam uma janela de retorno para permitir a geração de recursos que rastreiam o comportamento ao longo do tempo.
Para mais informações, consulte Noções básicas sobre o escopo e a duração dos dados.
- LRO
Várias operações de IA de AML, incluindo configuração do mecanismo, treinamento, backtesting e previsão, iniciam uma operação de longa duração (LRO).
Para mais informações, consulte Gerenciar operações de longa duração.
M
- Ausência de dados
A métrica de ausência é calculada para todas as famílias de recursos ao criar os seguintes recursos de IA de AML: configuração do mecanismo, modelo, resultados de backtest e resultados de previsão.
Essa métrica mostra a porcentagem de valores ausentes em todos os atributos de uma família de atributos. Uma mudança significativa na falta de dados para qualquer família de recursos entre ajuste, treinamento, avaliação e previsão pode indicar inconsistência nos conjuntos de dados usados.
- model
Um recurso de modelo de IA de AML (também conhecido como "modelo") representa um modelo treinado que pode ser usado para gerar pontuações de risco e explicabilidade.
- entidade mutável
A IA de AML precisa recriar visualizações dos dados em diferentes pontos no tempo para ajuste, treinamento e backtesting. Para fazer isso, a IA de AML diferencia entidades mutáveis (que podem mudar de valor ao longo do tempo) e imutáveis (que não mudam).
Por exemplo, uma entidade mutável pode ser o saldo da sua conta corrente, que pode mudar com o tempo. Já uma entidade imutável pode ser um evento, como sacar US $50 em 2 de julho de 2024 às 12h00min00s da sua conta corrente, que não muda, já que foi um instantâneo no tempo.
No modelo de dados de entrada da AML, as tabelas que representam entidades mutáveis têm os campos
validity_start_time
eis_entity_deleted
. Isso inclui as tabelas Party, AccountPartyLink, Transaction e PartySupplementaryData.Para mais informações, consulte Como os dados mudam ao longo do tempo.
Consulte também entidade imutável.
O
- observação-recordação
A IA de AML mede a performance do modelo em dados históricos usando a métrica de recuperação observada.
Essa métrica mostra a proporção de partes marcadas como positivas (por exemplo, saídas de clientes) de um período selecionado que teriam sido identificadas durante um período de atividade suspeita como de alto risco pelo modelo que está sendo avaliado.
P
- party
No modelo de dados de entrada da AML, uma parte representa um cliente do banco. Uma parte pode ser uma pessoa física ou jurídica.
Para mais informações, consulte a tabela Partido.
Consulte também parte registrada.
- previsão
Prediction usa um modelo para gerar pontuações de risco e explicabilidade, que podem ser usadas no processo de investigação de AML.
- resultados da previsão
Um recurso PredictionResult de IA de AML (também conhecido como "resultados de previsão") é o resultado do uso de um modelo para criar previsões.
Para mais detalhes sobre como gerar e usar pontuações de risco e explicabilidade no seu processo de investigação, consulte as páginas da seção Gerar pontuações de risco e explicabilidade.
R
- parte registrada
- Antes que uma parte possa ser usada para criar resultados de previsão (por exemplo, pontuações de risco e explicabilidade no nível da parte), a parte precisa estar registrada na linha de negócios correspondente.
- caso de risco
Um caso de risco abrange um processo de investigação ou um grupo de processos de investigação relacionados para diferentes partes.
Consulte a tabela RiskCaseEvent.
- dados de investigação de risco
Os dados de investigação de risco são usados pela IA de AML para entender o processo e os resultados da investigação de risco e gerar rótulos de treinamento.
- pontuação de risco
Os modelos de IA antilavagem de dinheiro são usados para identificar partes que apresentam comportamentos ou características com alto risco de lavagem de dinheiro. Isso é feito por meio de uma pontuação de risco.
As pontuações de risco variam de 0 a 1. Uma pontuação mais alta indica um risco maior. No entanto, as pontuações de risco não devem ser interpretadas diretamente como uma probabilidade de atividade de lavagem de dinheiro.
Para mais informações, consulte Entender as saídas de previsão.
- tipologia de risco
A IA antilavagem de dinheiro pode identificar o risco de lavagem de dinheiro em cinco tipologias de risco de AML relacionadas ao monitoramento de transações.
Com investigação suficiente e dados complementares da parte (consulte as tabelas de dados complementares), a IA antilavagem de dinheiro pode abranger mais tipologias.
S
- dados complementares
Os dados complementares são dados adicionais, além do que está contido nas áreas de dados bancários principais e dados de investigação de risco do esquema de IA antilavagem de dinheiro, que é relevante para prever o risco de lavagem de dinheiro.
Por exemplo, você pode identificar e adicionar um indicador de risco que ajude os modelos a prever melhor uma tipologia de risco que não é bem coberta.
É possível adicionar dados suplementares a um conjunto de dados usando a tabela PartySupplementaryData.
- período de atividade suspeita
Um período de atividade suspeita é um período em que você acredita que uma parte investigada apresentou comportamento suspeito. Isso é usado na avaliação do modelo (por exemplo, a métrica de recuperação para resultados de backtest) para confirmar que os clientes de alto risco são identificados nos meses em que tiveram atividade suspeita.
Para mais informações, consulte Ciclo de vida de um caso de risco.
T
- treinamento
- A IA AML faz o treinamento como parte da criação de um modelo usando hiperparâmetros (consulte ajuste) de uma configuração de mecanismo especificada.
- ajuste
- O ajuste é a otimização dos hiperparâmetros do modelo. A IA de AML faz o ajuste como parte da criação de uma configuração do mecanismo.
V
- Horário de início da validade
O horário de início de validade de uma entidade mutável é usado pela IA de AML para criar uma visualização do que era conhecido pelo banco em um determinado momento. Isso permite que a IA AML treine com precisão modelos que podem ser reutilizados nos dados mais recentes (ou seja, o que é conhecido pelo banco) para produzir escores de risco de alta fidelidade.
O horário de início de validade de uma linha representa o horário mais antigo em que os dados nesta linha foram conhecidos e corrigidos pelo banco.
Para mais informações, consulte Como os dados mudam ao longo do tempo.