Genere un modelo

En esta página, se describen brevemente los conceptos detrás del entrenamiento de modelos.

Cuándo entrenar o volver a entrenar

La IA contra el lavado de dinero entrena un modelo como parte de la creación de un recurso del modelo. El modelo debe entrenarse antes de que se pueda evaluar (es decir, realizar una prueba inversa) o usarse para generar resultados de predicción.

Para obtener el mejor rendimiento y mantener los modelos más actualizados, considera realizar un reentrenamiento mensual. Sin embargo, una versión de motor determinada admite la generación de resultados de predicción durante 12 meses desde el lanzamiento de una versión secundaria del motor más reciente.

Cómo entrenar

Para entrenar un modelo (es decir, crear un modelo), consulta Cómo crear y administrar modelos.

En particular, debes seleccionar las siguientes opciones:

  • Estos son los datos que se usarán para el entrenamiento:

    Especifica un conjunto de datos y una hora de finalización dentro del período del conjunto de datos.

    El entrenamiento usa etiquetas y funciones basadas en meses de calendario completos hasta el mes de la hora de finalización seleccionada, sin incluir el mes. Para obtener más información, consulta Intervalos de tiempo del conjunto de datos.

  • Una configuración de motor creada con un conjunto de datos coherente:

    Consulta Configura un motor.

Resultado de entrenamiento

El entrenamiento genera un recurso de modelo, que se puede usar para lo siguiente:

  • Crear resultados de la prueba inversa, que se usan para evaluar el rendimiento del modelo mediante verdaderos positivos conocidos actualmente
  • Crea resultados de predicción, que se usarán una vez que esté todo listo para comenzar a revisar casos nuevos de posible lavado de dinero

Los metadatos del modelo contienen la siguiente métrica. En particular, esta métrica te muestra los cambios grandes en las familias de atributos que admite el conjunto de datos (entre el ajuste del motor, el entrenamiento, la evaluación y la predicción).

Nombre de la métrica Descripción de la métrica Ejemplo de valor de la métrica
Falta de

Porcentaje de valores faltantes en todos los atributos de cada familia de atributos.

Lo ideal sería que todas las familias de atributos de IA contra el lavado de dinero tengan un valor de Falta de 0. Es posible que se produzcan excepciones cuando los datos subyacentes de esas familias de funciones no estén disponibles para la integración.

Un cambio significativo en este valor para cualquier familia de atributos entre el ajuste, el entrenamiento, la evaluación y la predicción puede indicar incoherencia en los conjuntos de datos usados.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Importancia

Una métrica que muestra la importancia de una familia de atributos para el modelo. Los valores más altos indican un uso más significativo de la familia de atributos en el modelo. Una familia de atributos que no se usa en el modelo no tiene importancia.

Los valores de importancia se pueden usar para priorizar actuar sobre resultados de sesgo familiar. Por ejemplo, es más urgente resolver el mismo valor de sesgo para una familia con mayor importancia para el modelo.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Los metadatos del modelo no contienen métricas de recuperación de un conjunto de prueba. Para generar mediciones de recuperación para un período específico (por ejemplo, el conjunto de prueba), consulta Evalúa un modelo.