Comprende el alcance y la duración de los datos

La IA de AML está configurada para evaluar el riesgo de lavado de dinero de una línea de negocio. Una LoB está asociada con uno de tus clientes minoristas o comerciales.

Cuando crees un conjunto de datos para usarlo con una línea de negocios, deberás incluir varias tablas. Cada tabla debe abarcar un período suficiente. Esta página ofrece un descripción general de las tablas que necesitarás y muestra cómo determinar el intervalo de tiempo que cada uno debe abarcar.

Tablas que se usarán

El conjunto de datos de BigQuery que se usa con la IA de AML debe contener las siguientes tablas:

  • Parte: Todas las partes relevantes de esa línea de negocio
    • Línea de negocios minorista: Todos los clientes de la banca minorista que tienen cuentas en cualquier punto en el intervalo de tiempo requerido
    • LoB comercial: Todos los clientes de la banca comercial (entidades jurídicas y físicas) que hayan tenido cuentas en cualquier momento del período requerido
  • AccountPartyLink: Es el historial completo de las cuentas que tenían las partes. Esto debería abarcar todas las cuentas de productos y servicios cuando una de las partes de la tabla Parte es el titular principal de la cuenta en cualquier punto en el intervalo de tiempo requerido.
  • Transacción: Todas las transacciones de las cuentas de la tabla AccountPartyLink para el período requerido.
  • RiskCaseEvent: Todos los eventos de casos de riesgo (consulta los valores de tipo de evento) para cualquier caso de riesgo y parte en la tabla de partes con un AML_PROCESS_START (inicio de la investigación) en el período requerido. Esta tabla puede incluir eventos que tienen una hora anterior o posterior al intervalo de tiempo requerido.
  • PartySupplementaryData: (Si se usa) De 0 a 100 datos únicos party_supplementary_data_id, incluye un historial completo de los valores de estos campos para todas las partes de la tabla Partes durante el intervalo de tiempo requerido.

Usa datos adicionales

Consulta la sección Datos complementarios si tienes datos adicionales sobre las partes (no se incluye de otra manera en el esquema) que sea relevante para la identificación de dinero riesgo de lavado.

Período del conjunto de datos

El intervalo de tiempo que cualquier tabla en un conjunto de datos debe abarcar se puede calcular de la siguiente manera: sigue para cualquier operación. Deberás saber lo siguiente:

  • Hora de finalización. Es la hora más reciente a partir de la cual se usan las etiquetas y los datos para generar atributos de ajuste.
  • La versión del motor (consulta la lista de versiones de motor) que usarás.
  • La operación que realizarás: ajustar, entrenar, predecir o hacer una prueba inversa.
  • Para las operaciones de predicción o de backtest, la cantidad de períodos durante los cuales se realizará la operación, que se especificará en la llamada a la API.

Comprende la duración del alcance de los datos

Primero, debes calcular la cantidad de períodos que utilizará la operación. Este es el número de meses consecutivos que finalizan en el último mes calendario completo anterior al la hora de finalización especificada, para la cual la IA contra el lavado de dinero evaluará los atributos del modelo.

  • Para las operaciones de predicción y simulación retrospectiva, esta es la cantidad de períodos de predicción o simulación retrospectiva especificados en la llamada a la API.
  • Para otras operaciones, esto depende de la versión del motor y de la operación. Por ejemplo, las versiones de motor v004.004 usan 18 períodos para el ajuste y 15 para el capacitación.

A continuación, debes calcular la ventana de visualización para cada tabla. Esta es la cantidad máxima la cantidad de meses de datos necesarios de esa tabla para que la IA contra el lavado de dinero calcule el modelo atributos durante un período determinado.

  • Por ejemplo, en el caso de las versiones de motor v004.004, son 13 meses para la transacción. y las tablas AccountPartyLink, 12 meses para la tabla RiskCaseEvent y 0 meses para las tablas Party y PartyCompanionaryData.

El conjunto de datos deberá abarcar la ventana de visualización de todos los períodos que use la operación elegida. Puedes calcular la cantidad de meses calendario completos de datos previos a la hora de finalización que necesitarás para una operación determinada con la siguiente fórmula:

  • cantidad de períodos + ventana de visualización -1

Por ejemplo, para realizar el ajuste de las versiones de motor v004.00X, necesitas lo siguiente:

  • 18 + 13 - 1 = 30 meses de datos de la transacción y el vínculo AccountPartyLink tablas,
  • 18 + 12 - 1 = 29 meses de datos de la tabla de eventos de casos de riesgo, así como más recientes para los casos de riesgo en la tabla,
  • Y 18 + 0 - 1 = 17 meses de datos de las tablas Party y PartySupplementaryData.