Descripción general de la preparación del modelo

En esta página, se explican los pasos para preparar una IA contra el lavado de dinero suponiendo que ya configuraste una instancia y preparaste los permisos necesarios conjuntos de datos.

Descripción general de las etapas

El proceso para preparar un modelo se aborda en las siguientes tres etapas:

Una vez que hayas completado las etapas anteriores y el rendimiento del modelo consulta la guía en las secciones Cómo generar puntuaciones de riesgo y explicabilidad y Prepárate para la administración de modelos y riesgos.

Antes de comenzar

Antes de comenzar, necesitarás lo siguiente:

Requisitos del conjunto de datos

Para obtener orientación detallada sobre el modelo de datos y el esquema, consulta las páginas de Prepara datos para la IA contra lavado de dinero. En esta sección, se explica cómo asegurarte de que los conjuntos de datos que se usan en el ajuste, el entrenamiento y la evaluación del motor funcionan bien en conjunto.

Intervalos de tiempo del conjunto de datos

El intervalo de tiempo mínimo de conjuntos de datos para cada operación se aborda en Comprende el alcance y la duración de los datos. En resumen, se requiere una ventana de visualización de 0 a 24 meses además de una ventana de tiempo principal de al menos 18 meses para cubrir todas las operaciones el mismo conjunto de datos. Se pueden usar conjuntos de datos más cortos para las operaciones individuales. por ejemplo, si reutilizas una configuración de motor y no necesitas realizar actualizaciones ajustes.

Por ejemplo, para el ajuste del motor, la tabla Transaction debe cubren al menos 42 meses (18 meses de ventana de tiempo principal y 24 meses durante ventana de visualización).

Se pueden completar la configuración de un motor, el entrenamiento y la evaluación (backtesting) con un solo conjunto de datos; mira la siguiente imagen. Para garantizar una buena producción rendimiento al evitar el sobreajuste, debe utilizar una ventana de tiempo principal para (es decir, crear resultados de backtest) que es inconexa y es más es reciente que la ventana de tiempo principal para el entrenamiento (es decir, la creación de un modelo).

Intervalos de tiempo del conjunto de datos para el ajuste, el entrenamiento y las pruebas retrospectivas

Coherencia con el conjunto de datos

Cuando se usan diferentes conjuntos de datos para el ajuste, el entrenamiento y la evaluación del motor etapas, hacen que los conjuntos de datos sean coherentes en qué campos se propagan y cómo se completen. Esto es importante para la estabilidad y el rendimiento de los modelos contra el lavado de dinero.

Del mismo modo, para una puntuación de riesgo de alta calidad, la conjunto de datos que se usa para crear los resultados de la predicción con un modelo debe ser coherente con el conjunto de datos que se usa para entrenar ese modelo.

En particular, asegúrate de lo siguiente:

  • Se usa la misma lógica para completar cada campo. Cambiar la lógica utilizada para propagar un campo puede introducir un sesgo de atributos entre elentrenamiento de modeloso para la predicción o evaluación del rendimiento.
  • Se propaga la misma selección de campos RECOMMENDED. Por ejemplo: quitar un campo que se propagó durante el entrenamiento de modelos puede generar atributos que el modelo necesita para estar sesgado o faltante durante la evaluación o para la predicción.
  • Se usa la misma lógica para proporcionar valores. En la PartySupplementaryData, se usa la misma lógica para proporciona valores para cada campo party_supplementary_data_id.

    • Se usan los mismos datos, pero con diferentes party_supplementary_data_id de salida, hace que el modelo use datos de forma incorrecta. Por ejemplo, un campo específico usa el ID 5 en el PartySupplementaryData para un conjunto de datos, pero usa el ID 7 de otro conjunto de datos.
    • Quitar un valor party_supplementary_data_id en el que se basa un modelo puede tener efectos impredecibles. Por ejemplo, el ID 3 se usa en el PartySupplementaryData en un conjunto de datos, pero omitidos de otro conjunto de datos.

Ahora tienes un conjunto de datos listo para el ajuste, el entrenamiento y la evaluación del motor. Nota que las operaciones del modelo pueden tardar decenas de horas. Para obtener información sobre cómo verificar si una operación aún se está ejecutando o se completó (falló o se realizó correctamente) ver Administra operaciones de larga duración.