Comprende el alcance y la duración de los datos

La IA contra el lavado de dinero se configuró para evaluar el riesgo de lavado de dinero en una línea de negocio. Una línea de negocios se asocia con uno de tus clientes minoristas o comerciales.

Cuando creas un conjunto de datos para usarlo con una LoB, primero debes determinar el intervalo de tiempo que debería abarcar el conjunto de datos.

Intervalo de tiempo del conjunto de datos

El intervalo de tiempo se compone de tres partes:

Gráfico de requisitos de datos históricos

  • Período principal: Este intervalo de tiempo debe estar cubierto por todas las tablas en el conjunto de datos. Las diferentes operaciones de la API tienen diferentes requisitos para el período principal a fin de generar funciones y etiquetas:

    • Crear una configuración de motor (para el ajuste): mínimo de 18 meses
    • Creación de un modelo (para entrenamiento): mínimo de 15 meses
    • Creación de los resultados de la predicción (para la puntuación): mínimo de 1 mes
    • Creación de los resultados de la prueba interna (para el backtesting o la evaluación del modelo): mínimo de 3 meses; incluye más meses para una evaluación más precisa

  • Ventana de visualización: Se necesitan 24 meses adicionales de datos antes de la ventana principal para admitir las funciones del modelo que hacen un seguimiento de la actividad a lo largo del tiempo. Los requisitos mínimos de la ventana de visualización varían según la tabla.

  • Eventos de caso de riesgo adicionales: Se pueden incluir datos sobre casos de riesgo más recientes que la hora de finalización del conjunto de datos a fin de tener etiquetas más completas para el entrenamiento y la evaluación de los modelos.

Por ejemplo, debes crear una configuración del motor para usar el resto de la IA contra el lavado de dinero. Debes crear un conjunto de datos que abarque al menos 42 meses de datos de transacciones (18 meses de ventana de tiempo principal y 24 meses de ventana de visualización).

Tablas para usar

Para un período principal y una LoB determinados, el conjunto de datos de BigQuery que se usa con la IA contra el lavado de dinero debe contener las siguientes tablas:

  • Grupo: Todas las partes relevantes para esa LoB durante todo el período principal (no se requiere ninguna ventana de visualización)
    • Línea de negocios minorista: Todos los clientes de banca minorista que tienen cuentas en cualquier momento de la ventana temporal principal
    • Línea de negocios comercial: Todos los clientes de banca comercial (entidades legales y naturales) que hayan tenido cuentas en cualquier momento del período principal
  • AccountPartyLink: Historial completo de qué cuentas mantenían las partes durante todo el período principal, así como una ventana de visualización de 24 meses. Esto debería abarcar todas las cuentas de productos y servicios cuando una de las partes de la tabla Party es (o fue) el titular de la cuenta principal
  • Transacción: Todas las transacciones de las cuentas de la tabla AccountPartyLink para todo el período principal y la ventana de visualización de 24 meses.
  • RiskCaseEvent: Todos los eventos de casos de riesgo (consulta los valores type del evento) para cualquier caso de riesgo y parte en la tabla Party con un AML_PROCESS_START (inicio de la investigación) en la ventana de tiempo principal y una ventana de visualización mínima de 12 meses Algunos de estos eventos pueden tener una hora del evento anterior o posterior a la ventana de tiempo principal y la ventana de visualización.
  • PartySupplementaryData: Si se usa, para entre 0 y 100 valores party_supplementary_data_id únicos, incluye un historial completo de los valores de estos campos correspondientes a todas las partes de la tabla Party para el período principal. No se requiere ninguna ventana de visualización.

Usa datos adicionales

Consulta Datos complementarios si tienes datos adicionales sobre las partes (que no están cubiertos en el esquema) que sean relevantes para identificar riesgos de lavado de dinero.