Descripción general de la preparación del modelo

En esta página, se explican los pasos para preparar un modelo de IA contra el lavado de dinero, suponiendo que ya configuraste una instancia y preparaste los conjuntos de datos necesarios.

Descripción general de las etapas

El proceso de preparación de un modelo se abarca en las siguientes tres etapas:

Una vez que hayas completado las etapas anteriores y el rendimiento del modelo satisfaga tus necesidades, consulta la guía en las secciones Genera puntuaciones de riesgo y explicabilidad y Prepárate para la administración de modelos y riesgos.

Antes de comenzar

Antes de comenzar, necesitarás lo siguiente:

Requisitos del conjunto de datos

Para obtener una guía detallada sobre el modelo y el esquema de datos, consulta las páginas en Prepara datos para la IA contra el lavado de dinero. En esta sección, se explica cómo asegurarte de que los conjuntos de datos usados en el ajuste, el entrenamiento y la evaluación del motor funcionen bien juntos.

Intervalos del conjunto de datos

El intervalo de tiempo mínimo de los conjuntos de datos para cada operación se abarca en Información sobre el alcance y la duración de los datos. En resumen, se requiere una ventana de visualización de 0 a 24 meses según la tabla, además de un período principal de al menos 18 meses.

Por ejemplo, para el ajuste del motor, la tabla Transaction debe cubrir al menos 42 meses (ventana de tiempo principal de 18 meses y 24 meses de período de visualización).

La configuración de un motor, el entrenamiento y la evaluación (prueba posterior) se pueden completar con un solo conjunto de datos. Consulta la siguiente imagen. Para garantizar un buen rendimiento de producción evitando el sobreajuste, debes usar un período principal para la evaluación (es decir, la creación de resultados de la prueba interna) que sea inconexo y más reciente que el período principal del entrenamiento (es decir, la creación de un modelo).

Intervalos de tiempo del conjunto de datos para el ajuste, el entrenamiento y el backtesting

Coherencia del conjunto de datos

Cuando uses diferentes conjuntos de datos para las etapas de ajuste, entrenamiento y evaluación del motor, haz que los conjuntos de datos sean coherentes en qué campos se propagan y cómo se propagan. Esto es importante para la estabilidad y el rendimiento de los modelos contra el lavado de dinero.

De manera similar, para obtener una puntuación de riesgo de alta calidad, el conjunto de datos que se usa a fin de crear resultados de predicción con un modelo debe ser coherente con el conjunto de datos que se usa para entrenar ese modelo.

En particular, asegúrate de lo siguiente:

  • Se usa la misma lógica para propagar cada campo. Cambiar la lógica que se usa para propagar un campo puede generar un sesgo de atributos entre el entrenamiento de modelos y la predicción o evaluación.
  • Se propaga la misma selección de campos RECOMMENDED. Por ejemplo, quitar un campo que se propagó durante el entrenamiento de modelos puede hacer que los atributos en los que se basa el modelo se distorsionen o falten durante la evaluación o la predicción.
  • Se usa la misma lógica para proporcionar valores. En la tabla PartySupplementaryData, se usa la misma lógica para proporcionar valores para cada campo party_supplementary_data_id.

    • El uso de los mismos datos, pero con diferentes valores de party_supplementary_data_id, hace que el modelo los use de forma incorrecta. Por ejemplo, un campo en particular usa el ID 5 en la tabla PartySupplementaryData para un conjunto de datos, pero luego usa el ID 7 en otro conjunto.
    • Quitar un valor party_supplementary_data_id en el que se basa un modelo puede tener efectos impredecibles. Por ejemplo, el ID 3 se usa en la tabla PartySupplementaryData en un conjunto de datos, pero se omite de otro conjunto.

Ahora tienes un conjunto de datos listo para el ajuste, el entrenamiento y la evaluación de motores. Ten en cuenta que las operaciones del modelo pueden tardar decenas de horas. Para obtener información sobre cómo verificar si una operación aún está en ejecución o se completó (falló o tuvo éxito), consulta la sección sobre cómo administrar operaciones de larga duración.