Descripción general
En esta página, se proporciona una descripción general de los procesos de IA de la AML y se abordan los conceptos clave que los clientes deben comprender. Se orienta principalmente a los equipos que usarán la IA de AutoML para entrenar, probar e implementar modelos.
La IA de AML permite a los bancos entrenar, probar e implementar automáticamente modelos para detectar el lavado de dinero. Las guías de IA de la AML se dividen en cinco secciones de navegación izquierda que corresponden a los siguientes cinco pasos.
Paso | Descripción |
---|---|
1. Configura la IA contra lavado de dinero | Asegúrate de que tu proyecto de Google Cloud esté listo para usar la IA de la AML. Habilita los servicios de Google Cloud necesarios y configura el registro y las cuotas. Crea una o más instancias de IA de AML. |
2. Prepara datos para la IA contra el lavado de dinero | Revisa el modelo de datos y el esquema. Prioriza qué datos incluir. Recopila y transforma los datos bancarios principales, los datos de investigación de riesgos y cualquier otro dato que necesites. Crea y valida un conjunto de datos. |
3. Genera un modelo y evalúa el rendimiento | Comprende los motores, los modelos y las pruebas retrospectivas de la IA de la AML.
|
4. Genera puntuaciones de riesgo y explicabilidad | Registra a tus clientes de banca minorista y comercial. Usa un modelo para generar puntuaciones de riesgo y explicabilidad por parte:
|
5. Prepárate para la gobernanza de modelos y riesgos | Combina los resultados de la IA de la AML de la optimización, el entrenamiento, la evaluación y la predicción con el concepto de AML y la documentación del producto para cumplir con los requisitos de tu proceso de administración de riesgos de modelos. |
Las operaciones técnicas principales de la IA de la AML para crear, probar e implementar modelos son las siguientes. Estos admiten los pasos 2 a 4 de la tabla anterior.
- Create AML AI Dataset: Crea un conjunto estructurado de tablas de datos de entrada de BigQuery para la IA contra el lavado de dinero.
- Configuración del motor: Ajusta un motor de IA contra lavado de dinero a un conjunto de datos de IA contra lavado de dinero, incluido el ajuste de hiperparámetros.
- Entrenamiento de modelos: Entrena un modelo de IA contra el lavado de dinero con una configuración del motor y un conjunto de datos.
- Backtest: Prueba un modelo de IA contra el lavado de dinero con datos históricos en un conjunto de datos y resume el rendimiento.
- Register Parties: Registra a las partes (clientes del banco que tienen productos bancarios y envían o reciben transacciones) para que se les pueda asignar una puntuación en la predicción.
- Predicción: Produce puntuaciones de partido y explicabilidad para usar en producción.
La configuración del motor, el entrenamiento de modelos, la simulación de modelos y la predicción de modelos requieren un conjunto de datos de IA de AA como entrada y muestran los artefactos correspondientes que se usan en otras operaciones. Por ejemplo, Model Training muestra una referencia a un modelo de IA de AML entrenado que se puede usar para la simulación de pruebas o la predicción. Para obtener detalles técnicos de las operaciones, consulta la descripción general de la referencia de REST.
Árbol de dependencias para los procesos de IA de la AML
Consideraciones importantes para usar la IA de la AML
Esta sección está diseñada para brindar a los clientes una introducción a los conceptos clave de la IA de la AML y aconsejar sobre algunas prácticas recomendadas. Los temas que se incluyen aquí se tratan con más detalle en guías específicas y se proporcionan vínculos para lecturas adicionales.
Coherencia de las fechas
La IA de la AML usa diferentes períodos para diferentes operaciones. Se debe tener cuidado con las fechas seleccionadas para cada operación para garantizar resultados confiables. En particular, para evitar sesgos en los resultados, es importante que los meses que se usen para entrenar un modelo de IA de AML no se superpongan con los meses que se usen para la simulación de pruebas.
Dado que un conjunto de datos de IA de AML contiene muchos meses de datos, los conjuntos de datos se pueden usar para varias operaciones, sujetas a estas selecciones de fecha correctas. En el siguiente diagrama, se ilustra un ciclo de desarrollo con IA de AML, en el que se usan diferentes períodos dentro de un solo conjunto de datos que abarcan 42 meses para configurar un motor (ajuste de hiperparámetros), entrenamiento y pruebas retrospectivas. Todos estos procesos usan ventanas de visualización que proporcionan contexto al modelo y pueden superponerse de forma segura con los datos que se usan para otras operaciones.
Para obtener más información sobre los conjuntos de datos de IA de la AML y los períodos para diferentes operaciones, consulta Comprende el alcance y la duración de los datos.
Para asegurarte de registrar los cambios en tus datos a lo largo del tiempo de forma correcta, consulta Cambios en los datos a lo largo del tiempo.
Frecuencia del lote de producción
En la predicción, la IA de la AML produce puntuaciones de riesgo de la AML por mes calendario. Los clientes suelen usar la IA de la AML como parte de un proceso por lotes mensual y se les recomienda ejecutar predicciones en meses con datos de transacciones completos tanto como sea posible.
Coherencia de los campos
Al igual que con cualquier proceso de aprendizaje automático, los datos deben ser lo más coherentes posible entre los datos de entrenamiento y los de prueba. Si los campos no se completan de forma coherente, los cambios pueden generar resultados poco confiables. Se recomienda encarecidamente que se tomen medidas para garantizar que los campos se propaguen de manera coherente para cada operación en un ciclo de desarrollo, y esto es especialmente cierto si se usan diferentes conjuntos de datos para cada operación. Para obtener más información, consulta coherencia del conjunto de datos.
Parámetros de configuración del motor
Una vez que se crea una configuración de motor, por lo general, no es necesario volver a crearla para cada conjunto de datos nuevo o en cada ciclo de desarrollo. Los hiperparámetros que se eligen en la configuración de un motor para un conjunto de datos suelen tener un buen rendimiento en conjuntos de datos similares.
Los ciclos de desarrollo iterativos se ilustran en el siguiente diagrama, mientras que el diagrama anterior usa un solo conjunto de datos para las operaciones de entrenamiento de modelos y de pruebas retrospectivas.
Para obtener más información, consulta cuándo ajustar o heredar.
Linaje de datos
La mayoría de las políticas de gobernanza de modelos definen un requisito para hacer un seguimiento del linaje de datos que se usa en todas las operaciones de AA, desde la configuración del motor, el entrenamiento, la evaluación y la predicción. Los clientes son responsables de realizar un seguimiento de este linaje de datos.
Te recomendamos que uses un identificador único en los nombres de todos los datos de entrada, los recursos de IA de AML y los datos de salida para hacer un seguimiento del linaje en todas las etapas. Esto ayuda a garantizar una vinculación sólida entre los recursos en una ejecución en particular. Los clientes también pueden etiquetar todos los recursos de IA de la AML para cumplir con los requisitos de linaje.
Además, te recomendamos que uses instantáneas de BigQuery en las solicitudes a la API para asegurarte de tener un linaje de datos preciso.
Esta configuración ayuda a responder preguntas como "¿de dónde proviene esta configuración del motor?" y "¿de dónde proviene este modelo?", a la vez que ayuda a investigar y resolver incidentes.
Para obtener detalles sobre cómo crear y administrar recursos de IA de AML, consulta las páginas de la API de REST.