Ringkasan proses

Ringkasan

Halaman ini memberikan ringkasan proses AI AML dan membahas konsep utama yang perlu dipahami pelanggan. Ini terutama ditargetkan pada tim yang akan menggunakan AML AI untuk melatih, menguji, dan men-deploy model.

Dengan AML AI, bank dapat secara otomatis melatih, menguji, dan men-deploy untuk mendeteksi pencucian uang. Panduan AML AI dibagi menjadi lima bagian navigasi kiri yang sesuai dengan langkah.

LangkahDeskripsi
1. Menyiapkan AML AI Pastikan project Google Cloud Anda siap menggunakan AML AI. Aktifkan layanan Google Cloud yang diperlukan serta siapkan logging dan kuota. Buat satu atau beberapa instance AML AI.
2. Menyiapkan data untuk AML AI Tinjau model dan skema data. Prioritaskan data mana yang akan disertakan. Kumpulkan dan ubah data inti perbankan, data investigasi risiko, dan data lain yang diperlukan. Membuat dan memvalidasi set data.
3. Membuat model dan mengevaluasi performa Memahami mesin, model, dan uji coba AML AI.
  1. Mengonfigurasi engine
  2. Melatih model
  3. Mengevaluasi performa model
4. Membuat skor risiko dan penjelasannya Daftarkan pelanggan perbankan retail dan komersial Anda. Gunakan model untuk menghasilkan skor risiko per pihak dan penjelasan untuk:
  • Analisis dan pengujian tata kelola risiko
  • Penggunaan praproduksi dan produksi
5. Mempersiapkan model dan tata kelola risiko Gabungkan output AML AI dari penyesuaian, pelatihan, evaluasi, dan prediksi dengan konsep AML dan dokumentasi produk untuk memenuhi persyaratan proses tata kelola risiko model Anda.

Operasi teknis inti AML AI untuk membuat, menguji, dan men-deploy adalah sebagai berikut. Tindakan ini mendukung langkah 2-4 dalam tabel sebelumnya.

  1. Buat Set Data AML AI - membuat kumpulan data terstruktur Tabel data input BigQuery untuk AML AI
  2. Konfigurasi Mesin - menyesuaikan mesin AML AI ke Set data AML AI, termasuk penyesuaian hyperparameter
  3. Pelatihan Model - melatih model AML AI menggunakan Engine Konfigurasi dan set data
  4. Backtest - menguji model AML AI berdasarkan histori data pada set data dan merangkum performa
  5. Daftar Pihak - mendaftarkan pihak (pelanggan bank yang telah produk perbankan dan mengirim atau menerima transaksi) agar dapat dinilai prediksi
  6. Prediksi - menghasilkan skor pihak dan penjelasan untuk digunakan dalam produksi

Konfigurasi Mesin, Pelatihan Model, Uji Balik Model, dan Prediksi Model memerlukan set data AML AI sebagai input dan menampilkan artefak yang sesuai yang digunakan dalam operasi lain. Misalnya, Pelatihan Model menampilkan referensi ke model AML AI terlatih yang dapat digunakan untuk backtest atau prediksi. Untuk detail teknis operasi, lihat Ringkasan Referensi REST.

Hierarki dependensi untuk proses AML AI

Hierarki dependensi untuk proses AML AI

Pertimbangan penting saat menggunakan AML AI

Bagian ini dirancang untuk memberikan pengantar konsep utama kepada pelanggan tentang AML AI dan memberikan saran tentang beberapa praktik terbaik. Topik di sini adalah dibahas lebih detail dalam panduan dan tautan khusus untuk informasi lebih lanjut sebelumnya.

Konsistensi tanggal

AML AI menggunakan jangka waktu yang berbeda untuk operasi yang berbeda. Tanggal yang dipilih untuk setiap operasi harus berhati-hati untuk memastikan hasil yang dapat diandalkan. Secara khusus, untuk menghindari bias dalam hasil, perlu dilakukan bulan yang digunakan untuk melatih model AML AI tidak tumpang tindih dengan bulan yang digunakan untuk uji coba.

Karena set data AML AI berisi data berbulan-bulan, dapat digunakan untuk beberapa operasi, tunduk pada pemilihan tanggal yang benar ini. Diagram berikut mengilustrasikan siklus pengembangan menggunakan AML AI, di mana jangka waktu yang berbeda dalam satu {i>dataset<i} yang mencakup 42 bulan digunakan untuk mengonfigurasi mesin (tuning hyperparameter), pelatihan, dan pengujian ulang. Semua proses ini menggunakan periode lihat balik yang memberikan konteks tumpang tindih secara aman dengan data yang digunakan untuk operasi lain.

Untuk informasi lebih lanjut tentang set data AML AI dan jangka waktu untuk berbagai operasi, lihat Memahami cakupan dan durasi data.

Untuk memastikan Anda mencatat perubahan pada data dari waktu ke waktu dengan benar, lihat Perubahan data dari waktu ke waktu.

Membuat set data AML AI - langkah 1-4

Frekuensi batch produksi

Dalam prediksi, AML AI menghasilkan skor risiko AML setiap bulan kalender. Pelanggan biasanya menggunakan AML AI sebagai bagian dari proses batch bulanan, dan mereka dianjurkan untuk menjalankan prediksi pada bulan dengan data transaksi lengkap sebanyak mungkin.

Konsistensi kolom

Seperti halnya proses machine learning, data harus sekonsisten mungkin antara data pelatihan dan data pengujian. Jika kolom tidak diisi secara konsisten, perubahan tersebut dapat menyebabkan hasil yang tidak dapat diandalkan. Sangat disarankan agar langkah-langkah dilakukan untuk memastikan kolom diisi secara konsisten untuk setiap operasi dalam siklus pengembangan ——dan ini terutama berlaku jika {i>dataset<i} yang berbeda digunakan untuk setiap operasi. Untuk informasi selengkapnya, lihat konsistensi set data.

Konfigurasi mesin

Setelah konfigurasi engine dibuat, biasanya tidak perlu membuat ulang untuk setiap {i>dataset<i} baru atau di setiap siklus pengembangan. Hyperparameter yang dipilih dalam konfigurasi mesin untuk satu set data umumnya berperforma baik pada {i>dataset<i} aslinya.

Siklus pengembangan berulang diilustrasikan dalam diagram berikut, sedangkan diagram sebelumnya menggunakan satu set data untuk Pelatihan Model dan Uji-Kembali operasional bisnis.

Untuk informasi selengkapnya, lihat kapan harus men-tuning atau mewarisi.

Membuat set data AML AI - langkah 3-4

Silsilah data

Sebagian besar kebijakan tata kelola model menentukan persyaratan untuk melacak silsilah data yang digunakan di semua operasi ML dari konfigurasi mesin, pelatihan, evaluasi, dan prediksi. Pelanggan bertanggung jawab untuk melacak garis keturunan data ini.

Sebaiknya gunakan ID unik dalam nama untuk semua data input, resource AI AML, dan data output untuk melacak garis keturunan di seluruh tahap. Hal ini membantu memastikan keterkaitan yang kuat antara resource dalam suatu operasi tertentu. Pelanggan juga dapat memberi label pada semua resource AML AI untuk memenuhi persyaratan lineage.

Selain itu, sebaiknya gunakan snapshot BigQuery dalam permintaan API untuk memastikan silsilah data yang akurat.

Konfigurasi ini membantu menjawab pertanyaan seperti "di mana mesin ini konfigurasi asal?" dan “dari mana model ini berasal?” sembari membantu untuk menyelidiki dan menyelesaikan insiden.

Untuk mengetahui detail cara membuat dan mengelola resource AML AI, lihat REST API.

Buat set data AML AI - langkah 3-4