Descripción general
En esta página, se proporciona una descripción general de los procesos de IA contra el lavado de dinero y se abordan conceptos clave. que los clientes deben comprender. Se orienta principalmente a los equipos que usarán la IA de AutoML para entrenar, probar e implementar modelos.
La IA contra el lavado de dinero permite a los bancos entrenar, probar e implementar automáticamente para detectar el lavado de dinero. Las guías de IA de la AML se dividen en cinco secciones de navegación izquierda que corresponden a los siguientes cinco pasos.
Paso | Descripción |
---|---|
1. Configura la IA contra lavado de dinero | Asegúrate de que tu proyecto de Google Cloud esté listo para usar la IA de la AML. Habilita los servicios de Google Cloud necesarios y configura el registro y las cuotas. Crea una o más instancias de IA contra lavado de dinero. |
2. Prepara datos para la IA contra lavado de dinero | Revisa el modelo de datos y el esquema. Prioriza qué datos incluir. Recopila y transforma los datos bancarios principales, los datos de investigación de riesgos y cualquier otro dato que necesites. Crear y validar un conjunto de datos |
3. Genera un modelo y evalúa el rendimiento | Comprende los motores, los modelos y las pruebas retrospectivas de la IA de la AML.
|
4. Generar puntuaciones de riesgo y explicabilidad | Registra a tus clientes minoristas y de banca comercial. Usa un modelo para generar puntuaciones de riesgo y explicabilidad por parte:
|
5. Prepárate para la gobernanza de modelos y riesgos | Combina los resultados de la IA contra el lavado de dinero a partir del ajuste, el entrenamiento evaluación y predicción con el concepto de AML y la documentación del producto cumplir con los requisitos del proceso de administración del riesgo de tu modelo. |
Las principales operaciones técnicas de IA contra el lavado de dinero para crear, probar e implementar son los siguientes. Estos admiten los pasos 2 a 4 de la tabla anterior.
- Crear un conjunto de datos de IA contra lavado de dinero: Crea un conjunto estructurado de Tablas de datos de entrada de BigQuery para la IA contra lavado de dinero
- Configuración del motor: Ajusta un motor de IA contra lavado de dinero a un Conjunto de datos de IA contra el lavado de dinero, incluido el ajuste de hiperparámetros
- Entrenamiento de modelos: Entrena un modelo de IA contra el lavado de dinero con una configuración del motor y un conjunto de datos.
- Backtest: Prueba un modelo de IA contra lavado de dinero comparado con datos históricos. datos de un conjunto de datos y resume el rendimiento
- Register Parties: Registra a las partes (clientes del banco que tienen productos bancarios y envían o reciben transacciones) para que se les pueda asignar una puntuación en la predicción.
- Predicción: Produce puntuaciones de partido y explicabilidad para usar en producción.
La configuración del motor, el entrenamiento de modelos, la simulación de modelos y la predicción de modelos requieren un conjunto de datos de IA de AML como entrada y muestran los artefactos correspondientes que se usan en otras operaciones. Por ejemplo, Entrenamiento de modelos devuelve una referencia a un modelo de IA contra lavado de dinero entrenado que puede usarse para hacer la prueba atractiva o para la predicción. Para obtener detalles técnicos de las operaciones, consulta la Descripción general de la referencia de REST
Árbol de dependencias para procesos de IA contra lavado de dinero
Consideraciones importantes cuando se usa la IA contra lavado de dinero
Esta sección está diseñada para ofrecer a los clientes una introducción a los conceptos clave de la IA contra el lavado de dinero y asesorar sobre algunas prácticas recomendadas. Los temas que se incluyen aquí se tratan con más detalle en guías específicas y se proporcionan vínculos para lecturas adicionales.
Coherencia de las fechas
La IA de la AML usa diferentes períodos para diferentes operaciones. Se debe tener cuidado con las fechas seleccionadas para cada operación para garantizar resultados confiables. En particular, para evitar sesgos en los resultados, es importante que los meses usados para entrenar un modelo de IA contra lavado de dinero no se superponen los meses usados para hacer pruebas inversas.
Dado que un conjunto de datos de IA contra lavado de dinero contiene muchos meses de datos, los conjuntos de datos se puede usar para varias operaciones, sujeto a estas selecciones de fechas correctas. En el siguiente diagrama, se ilustra un ciclo de desarrollo con IA de AML, en el que se usan diferentes períodos dentro de un solo conjunto de datos que abarcan 42 meses para configurar un motor (ajuste de hiperparámetros), entrenamiento y pruebas retrospectivas. Todos estos procesos usan ventanas de visualización que proporcionan contexto al modelo y pueden superponerse de forma segura con los datos que se usan para otras operaciones.
Para obtener más información sobre los conjuntos de datos de IA de la AML y los períodos para diferentes operaciones, consulta Comprende el alcance y la duración de los datos.
Para asegurarte de registrar los cambios en tus datos a lo largo del tiempo de forma correcta, consulta Cambios en los datos a lo largo del tiempo.
Frecuencia por lotes de producción
En la predicción, la IA de la AML produce puntuaciones de riesgo de la AML por mes calendario. Los clientes suelen usar la IA contra lavado de dinero como parte de un proceso por lotes mensual y se se aconseja ejecutar predicciones en meses con datos completos de las transacciones, como sea posible.
Coherencia de campos
Al igual que con cualquier proceso de aprendizaje automático, los datos deben ser lo más coherentes posible entre los datos de entrenamiento y los de prueba. Si los campos no se completan de manera coherente, los cambios pueden generar resultados poco confiables. Se recomienda encarecidamente que se tomen medidas para garantizar que los campos se propaguen de manera coherente para cada operación en un ciclo de desarrollo, y esto es especialmente cierto si se usan diferentes conjuntos de datos para cada operación. Para obtener más información, consulta coherencia del conjunto de datos.
Parámetros de configuración del motor
Por lo general, una vez que se crea la configuración de un motor, no es necesario volver a crearla con cada conjunto de datos nuevo o en cada ciclo de desarrollo. Los hiperparámetros que se eligen en la configuración de un motor para un conjunto de datos suelen tener un buen rendimiento en conjuntos de datos similares.
Los ciclos de desarrollo iterativos se ilustran en el siguiente diagrama, mientras que En el diagrama anterior, se usa un conjunto de datos único para el entrenamiento de modelos y la prueba. las operaciones.
Para obtener más información, consulta cuándo ajustar o heredar.
Linaje de datos
La mayoría de las políticas de administración de modelos definen un requisito para hacer un seguimiento del linaje de datos utilizado en todas las operaciones de AA, desde la configuración del motor, el entrenamiento, la evaluación y para la predicción. Los clientes son responsables de realizar un seguimiento de este linaje de datos.
Recomendamos usar un identificador único en los nombres de todos los datos de entrada Recursos de IA contra el lavado de dinero y datos de salida para hacer un seguimiento del linaje en todas las etapas. Esto ayuda a garantizar una vinculación sólida entre los recursos en una ejecución en particular. Los clientes también pueden etiquetar todos los recursos de IA de la AML para cumplir con los requisitos de linaje.
Además, te recomendamos que uses instantáneas de BigQuery en las solicitudes a la API para asegurarte de tener un linaje de datos preciso.
Esta configuración ayuda a responder preguntas como "¿Dónde de dónde proviene la configuración actual?” y "¿de dónde provino este modelo?". mientras ayudas para investigar y resolver incidentes.
Si quieres obtener información para crear y administrar recursos de IA contra lavado de dinero, consulta el Páginas de la API de REST