En esta página, se describen brevemente los conceptos detrás del entrenamiento de modelos. Un recurso de modelo de IA de AML representa un modelo entrenado que se puede usar para generar puntuaciones de riesgo y explicabilidad.
Cuándo entrenar o volver a entrenar
La IA de AML entrena un modelo como parte de la creación de un recurso de modelo. El modelo debe entrenarse antes de que se pueda evaluar (es decir, realizar una prueba retrospectiva) o usar para generar resultados de predicción.
Para obtener el mejor rendimiento y mantener los modelos más actualizados, considera volver a entrenarlos mensualmente. Sin embargo, una versión determinada del motor admite la generación de resultados de predicción durante 12 meses a partir del lanzamiento de una versión secundaria más reciente del motor.
Cómo entrenar
Para entrenar un modelo (es decir, crearlo), consulta Crea y administra modelos.
En particular, debes seleccionar lo siguiente:
Los datos que se usarán para el entrenamiento:
Especifica un conjunto de datos y una hora de finalización dentro del período del conjunto de datos.
El entrenamiento usa etiquetas y funciones basadas en meses calendario completos hasta el mes de la hora de finalización seleccionada, pero no lo incluye. Para obtener más información, consulta Intervalos de tiempo de los conjuntos de datos.
Una configuración del motor creada con un conjunto de datos coherente:
Consulta Cómo configurar un motor.
Resultado de entrenamiento
El entrenamiento genera un recurso de modelo, que se puede usar para lo siguiente:
- Crear resultados de pruebas retrospectivas, que se usan para evaluar el rendimiento del modelo con los verdaderos positivos conocidos actualmente
- Crear resultados de predicción, que se usan una vez que tengas todo listo para comenzar a revisar casos nuevos en busca de posibles casos de lavado de dinero
Los metadatos del modelo contienen la métrica missingness
, que se puede usar para evaluar la coherencia del conjunto de datos (por ejemplo, comparando los valores faltantes de las familias de atributos de operaciones diferentes).
Nombre de la métrica | Descripción de la métrica | Ejemplo de valor de métrica |
---|---|---|
Faltan datos |
Porcentaje de valores faltantes en todos los atributos de cada familia de atributos. Idealmente, todas las familias de atributos de IA de AML deberían tener una falta cercana a 0. Pueden ocurrir excepciones cuando los datos subyacentes a esas familias de atributos no están disponibles para la integración. Un cambio significativo en este valor para cualquier familia de atributos entre la optimización, el entrenamiento, la evaluación y la predicción puede indicar inconsistencias en los conjuntos de datos utilizados. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Importancia |
Es una métrica que muestra la importancia de una familia de atributos para el modelo. Los valores más altos indican un uso más significativo de la familia de atributos en el modelo. Una familia de atributos que no se usa en el modelo tiene una importancia de cero. Los valores de importancia se pueden usar cuando se prioriza la acción en función de los resultados de sesgo familiar. Por ejemplo, el mismo valor de sesgo para una familia con mayor importancia para el modelo es más urgente de resolver. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
Los metadatos del modelo no contienen métricas de recuperación de un conjunto de prueba. Para generar mediciones de recuperación para un período específico (por ejemplo, el conjunto de prueba), consulta Evalúa un modelo.