En este glosario, se definen términos específicos de la IA de AML. Para conocer los términos generales del aprendizaje automático, consulta Glosario de aprendizaje automático.
B
backtesting
La prueba retrospectiva usa datos históricos para evaluar el rendimiento (recuperación observada) de un modelo mediante la comparación de las puntuaciones de riesgo que genera con los resultados reales de las investigaciones históricas.
resultados de la prueba
Se crea un recurso BacktestResult de IA de AML (también conocido como “resultados de backtest”) para probar el rendimiento de un modelo en un conjunto de datos. Para obtener más información, consulta Cómo evaluar un modelo.
C
datos bancarios básicos
Los datos bancarios principales incluyen datos sobre partes, transacciones y retenciones de cuentas. Ayuda a la IA de AML a comprender a tus clientes y su actividad bancaria para detectar características y comportamientos riesgosos.
ventana de tiempo principal
El período principal se refiere al intervalo de tiempo que se usa en una operación de IA de AML (configuración del motor, entrenamiento, pruebas retrospectiva y predicción) para generar entrenamiento, ejemplos de evaluación o resultados de modelos. Todas las tablas del conjunto de datos deben cubrir este intervalo de tiempo.
Las diferentes operaciones de la API tienen requisitos distintos para el período principal a fin de generar características y etiquetas. Para obtener más información, consulta Comprende el alcance y la duración de los datos.
D
conjunto de datos
Un recurso de conjunto de datos de AML AI (o solo “conjunto de datos”) se usa para especificar datos, de acuerdo con el modelo de datos de entrada de AML, que se puede usar para generar un modelo, evaluar su rendimiento y generar puntuaciones de riesgo y explicabilidad por parte. Para obtener más información, consulta Comprende el modelo de datos y los requisitos de AML.
validación de datos
La IA de AML realiza verificaciones de validación de datos cuando se crea un conjunto de datos, una configuración del motor, un modelo, los resultados de la prueba inversa o los resultados de la predicción. Si el conjunto de datos especificado no pasa la validación de datos, el recurso no se crea y se producen errores de validación de datos (que indican la naturaleza del problema). Para obtener más información, consulta Errores de validación de datos.
E.
hora de finalización
Las operaciones de AML AI que usan un conjunto de datos requieren que especifiques una hora de finalización. Este campo se usa a fin de controlar qué meses del conjunto de datos se usan para generar ejemplos de entrenamiento o evaluación y resultados de modelos.
La hora de finalización y todos los meses que se usan para una operación deben estar dentro del período del conjunto de datos asociado. Por ejemplo, una operación de entrenamiento requiere un período principal de 15 meses. Si usas un conjunto de datos con un período del 15 de octubre de 2021 al 21 de mayo de 2023 y una hora de finalización el 12 de abril de 2023, la capacitación usa ejemplos de los meses calendario de enero de 2022 a marzo de 2023, que está en el período del conjunto de datos.
configuración del motor
Un recurso EngineConfig de IA de AML (también conocido como “configuración de motor”) especifica parámetros para generar y evaluar un modelo de IA de AML y generar puntuaciones de riesgo y explicabilidad.
Algunos de estos parámetros se especifican en la llamada a la API para crear una configuración del motor, como la versión del motor y el volumen de investigación esperado. AML AI genera automáticamente otros parámetros mediante un conjunto de datos especificado, por ejemplo, hiperparámetros ajustados. Para obtener más información, consulta Configura un motor.
versión del motor
Un recurso EngineVersion de la IA de AML (también conocido como “versión de motor”) define aspectos sobre cómo la IA de AML detecta riesgos, lo que abarca el ajuste, el entrenamiento y la evaluación del modelo, así como el modelo de datos de AML y las familias de atributos generales.
En la configuración de un motor de IA de AML, se requiere que especifiques una versión del motor para su uso. Luego, la versión del motor se usa para entrenar y evaluar modelos con esa configuración de motor y generar puntuaciones de riesgo y explicabilidad.
Los nombres de las versiones del motor se estructuran de la siguiente manera: el tipo de motor expresa la línea de negocios compatible y las versiones principales, secundarias y del subtipo, el ajuste y la versión secundaria del motor que se actualizan a medida que se implementan nuevos comportamientos. Las versiones de ejemplo incluyen aml-retail.default.v002.000.202306-000
y aml-commercial.default.v002.000.202306-000
.
Para obtener más información sobre cómo administrar las versiones del motor, consulta Administra las versiones del motor.
sin conexión
Consulta backtesting.
explicabilidad
Los modelos de IA de AML se usan para identificar a las partes que exhiben comportamientos o características con alto riesgo de lavado de dinero. La explicabilidad indica qué comportamientos o características contribuyeron más a una puntuación de alto riesgo para una parte determinada. Para obtener más información, consulta Comprende los resultados de las predicciones.
metadatos de exportación
Varios recursos de AML AI almacenan información adicional relacionada con el rendimiento y la calidad de los datos, a la que se puede acceder mediante la operación de exportación de metadatos. Para obtener más información, consulta Modelo de datos de salida de AML.
F.
familia de funciones
Las familias de atributos son colecciones de atributos de AA relacionados que proporcionan una categorización simple y comprensible para las personas a fin de informar a los investigadores y los equipos de auditoría internos.
I
entidad inmutable
La IA de AML debe poder recrear vistas de los datos en diferentes momentos para el ajuste, el entrenamiento y la prueba inversa. Para lograrlo, la IA de AML diferencia entre entidades mutables, es decir, entidades que pueden cambiar valores con el tiempo, y entidades inmutables, como eventos, que, después de que aparecen o ocurren, no cambian de manera razonable.
En el modelo de datos de entrada de AML, las tablas que representan entidades inmutables no tienen los campos validity_start_time
ni is_entity_deleted
. Esto incluye la tabla RiskCaseEvent. Para obtener más información, consulta Comprende cómo cambian los datos con el tiempo.
Consulta también Entidad mutable.
instancia
Un recurso de instancia de AML AI (también conocido como “instancia”) se encuentra en la raíz de todos los demás recursos de IA de AML y debe crearse antes de que puedas trabajar con otros recursos de IA de AML. Se pueden crear varias instancias en la misma región dentro de un proyecto. Para obtener más información, consulta Crea una instancia de IA de AML.
proceso de investigación
Un proceso de investigación abarca toda la investigación o secuencia de investigaciones que se activan con una alerta. El proceso comienza cuando comienza la primera parte de una investigación y finaliza cuando no se esperan más resultados. Para obtener más información, consulta Ciclo de vida de un caso de riesgo.
L
línea de negocio
La línea de negocio distingue a los clientes de banca minorista y comercial en la IA de AML. Los conjuntos de datos, las versiones del motor y el registro de partes están vinculados a una línea de negocio específica, de venta minorista o comercial.
operación de larga duración (LRO)
Varias operaciones de AML AI, que incluyen la configuración del motor, el entrenamiento, la prueba inversa y la predicción, inician una operación de larga duración (LRO). Para obtener más información, consulta Administra operaciones de larga duración.
ventana de visualización
Además del período principal, las operaciones de AML AI requieren que los conjuntos de datos incluyan una ventana de visualización para permitir la generación de características que realicen un seguimiento del comportamiento en el tiempo. Para obtener más información, consulta Comprende el alcance y la duración de los datos.
M
Falta de contenido
La métrica de falta se calcula para todas las familias de atributos cuando se crean los siguientes recursos de IA de AML: configuración del motor, modelo, resultados de la prueba retrospectiva y resultados de la predicción.
Esta métrica muestra el porcentaje de valores faltantes en todos los atributos de una familia de atributos. Un cambio significativo en el campo Faltante de cualquier familia de atributos entre el ajuste, el entrenamiento, la evaluación y la predicción puede indicar una incoherencia en los conjuntos de datos utilizados.
model
Un recurso de modelo de IA de AML (también conocido como “modelo”) representa un modelo entrenado que se puede usar para generar puntuaciones de riesgo y explicabilidad.
Entidad mutable
La IA de AML debe poder recrear vistas de los datos en diferentes momentos para el ajuste, el entrenamiento y la prueba inversa. Para lograrlo, la IA de AML distingue entre entidades que pueden cambiar valores a lo largo del tiempo y entidades inmutables, como eventos, que, cuando se presentan o ocurren, no cambian de manera razonable.
En el modelo de datos de entrada de AML, las tablas que representan entidades mutables tienen los campos validity_start_time
y is_entity_deleted
. Esto incluye las tablas
Party, AccountPartyLink, Transaction y PartyComplementaryData.
Para obtener más información, consulta Comprende cómo cambian los datos a lo largo del tiempo.
Consulta también entidad inmutable.
O
recuperación observada
La IA de AML mide el rendimiento de los modelos en función de los datos históricos mediante la métrica de recuperación observada.
Esta métrica muestra la proporción de partes etiquetadas positivas (por ejemplo, las salidas del cliente) de un período seleccionado que, durante un período de actividad sospechosa, habrían sido identificados como de alto riesgo por el modelo que se está evaluando.
P
fiesta
En el modelo de datos de entrada de AML, una parte representa a un cliente del banco. Una parte puede ser una persona física o una entidad legal. Para obtener más información, consulta la tabla Party. Consulta también parte registrada.
Predicción
En la predicción, se usa un modelo para generar puntuaciones de riesgo y explicabilidad que se pueden usar en el proceso de investigación de AML.
resultados de la predicción
Un recurso PredictionResult de IA de AML (también conocido como “resultados de predicción”) es el resultado de usar un modelo para crear predicciones. Para obtener más detalles sobre cómo generar puntuaciones de riesgo y explicabilidad, y cómo usarlas en tu proceso de investigación, consulta las páginas de la sección Cómo generar puntuaciones de riesgo y explicabilidad.
R
partido registrado
Antes de que se pueda usar una parte para crear resultados de predicción (por ejemplo, puntuaciones de riesgo y explicabilidad a nivel de parte), la parte debe estar registrada en la línea de negocio correspondiente.
caso de riesgo
Un caso de riesgo abarca un proceso de investigación o un grupo de procesos de investigación relacionados para diferentes partes.
Consulta la tabla RiskCaseEvent.
datos de investigación de riesgos
AML AI usa los datos de investigación de riesgos para comprender el proceso y los resultados de la investigación de riesgos, y generar etiquetas de entrenamiento.
puntuación de riesgo
Los modelos de IA de AML se usan para identificar a las partes que exhiben comportamientos o características con alto riesgo de lavado de dinero. Esto se hace a través de una puntuación de riesgo.
Las puntuaciones de riesgo varían de 0 a 1. Una puntuación más alta indica un riesgo más alto. Sin embargo, las puntuaciones de riesgo no deben interpretarse directamente como una probabilidad de actividad de lavado de dinero. Para obtener más información, consulta Comprende los resultados de las predicciones.
tipología de riesgos
La IA de AML puede identificar el riesgo de lavado de dinero en cinco tipos de riesgo de AML principales relacionados con la supervisión de transacciones.
Con una investigación suficiente y datos complementarios de las partes (consulta las tablas de datos complementarios), la IA de AML puede cubrir más tipoologías.
S
datos complementarios
Los datos complementarios son datos adicionales que van más allá de los contenidos en las áreas de datos bancarios básicos y de datos de investigación de riesgos del esquema de IA de AA, que son relevantes para predecir el riesgo de lavado de dinero. Por ejemplo, puedes identificar y agregar un indicador de riesgo que ayude a los modelos a predecir mejor una tipología de riesgo que de otra manera no estaría bien cubierta.
Los datos complementarios se pueden agregar a un conjunto de datos mediante la tabla PartyComplementaryData.
período de actividad sospechosa
Un período de actividad sospechosa es aquel en el que consideras que una parte investigada demostró un comportamiento sospechoso. Se usa en la evaluación de modelos (por ejemplo, la métrica de recuperación para los resultados de la prueba interna) a fin de confirmar que los clientes de alto riesgo se identifican durante los meses en los que tuvieron actividad sospechosa. Para obtener más información, consulta Ciclo de vida de un caso de riesgo.
T
modelos
La IA de AML realiza el entrenamiento como parte de la creación de un modelo mediante hiperparámetros (consulta la sección sobre ajustes) a partir de una configuración de motor especificada.
ajuste
El ajuste es la optimización de los hiperparámetros del modelo. La IA de AML realiza ajustes como parte de la creación de una configuración del motor.
V
hora de inicio de la validez
La IA de AML usa la hora de inicio de la validez de una entidad mutable para crear una vista de lo que el banco conoció en un momento determinado. Esto permite que la IA de AML entrene con precisión modelos que se pueden reutilizar en los datos más recientes (es decir, los que el banco conoce actualmente) para producir puntuaciones de riesgo de alta fidelidad. La hora de inicio de la validez de una fila determinada representa la hora más temprana en la que el banco conoció y fueron correctos los datos de esta fila. Para obtener más información, consulta Comprende cómo cambian los datos con el tiempo.