Genere un modelo

En esta página, se abordan brevemente los conceptos detrás del entrenamiento de modelos. Un recurso de modelo de IA de AML representa un modelo entrenado que se puede usar para generar puntuaciones de riesgo y explicabilidad.

Cuándo entrenar o volver a entrenar

La IA de AML entrena un modelo como parte de la creación de un recurso de modelo. El modelo debe entrenarse antes de que se pueda evaluar (es decir, volver a probar) o usarse para generar resultados de predicción.

Para obtener el mejor rendimiento y mantener los modelos más actualizados, considera volver a entrenarlos mensualmente. Sin embargo, una versión determinada del motor admite la generación de resultados de predicción durante 12 meses a partir del lanzamiento de una versión secundaria más reciente del motor.

Cómo entrenar

Para entrenar un modelo (es decir, crear un modelo), consulta Crea y administra modelos.

En particular, debes seleccionar lo siguiente:

  • Los datos que se usarán para el entrenamiento:

    Especifica un conjunto de datos y una hora de finalización dentro del período del conjunto de datos.

    La capacitación usa etiquetas y funciones basadas en meses calendario completos, hasta pero sin incluir, el mes de la hora de finalización seleccionada. Para obtener más información, ver Intervalos de tiempo del conjunto de datos.

  • Una configuración de motor creada con un conjunto de datos coherente:

    Consulta Configura un motor.

Resultado de entrenamiento

El entrenamiento genera un recurso de modelo, que se puede usar para lo siguiente:

  • Crear resultados de pruebas retrospectivas, que se usan para evaluar el rendimiento del modelo con los verdaderos positivos conocidos actualmente
  • Crear resultados de predicción, que se usan una vez que tengas todo listo para comenzar a revisar casos nuevos en busca de posibles casos de lavado de dinero

Los metadatos del modelo contienen la métrica missingness, que se puede usar para evaluar la coherencia del conjunto de datos (por ejemplo, comparando los valores faltantes de las familias de atributos de operaciones diferentes).

Nombre de la métrica Descripción de la métrica Ejemplo de valor de métrica
Faltan datos

Porcentaje de valores faltantes en todos los atributos de cada familia de atributos.

Idealmente, todas las familias de atributos de IA de AML deberían tener una falta cercana a 0. Pueden ocurrir excepciones cuando los datos subyacentes a esas familias de atributos no están disponibles para la integración.

Un cambio significativo en este valor para cualquier familia de atributos entre el ajuste el entrenamiento, la evaluación y la predicción pueden indicar una incoherencia conjuntos de datos usados.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Importancia

Es una métrica que muestra la importancia de una familia de atributos para el modelo. Los valores más altos indican un uso más significativo de la familia de atributos en el modelo. Una familia de atributos que no se usa en el modelo tiene una importancia cero.

Los valores de importancia se pueden usar a la hora de priorizar las acciones basadas en resultados de sesgos para la familia. Por ejemplo, es más urgente de resolver el mismo valor de sesgo para una familia con mayor importancia para el modelo.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Los metadatos del modelo no contienen métricas de recuperación de un conjunto de prueba. Para generar mediciones de recuperación para un período específico (por ejemplo, el conjunto de prueba), consulta Evalúa un modelo.