Ringkasan
Halaman ini memberikan ringkasan proses AI AML dan membahas konsep utama yang perlu dipahami pelanggan. Kursus ini terutama ditujukan untuk tim yang akan menggunakan AML AI untuk melatih, menguji, dan men-deploy model.
AI AML memungkinkan bank melatih, menguji, dan men-deploy model secara otomatis untuk mendeteksi pencucian uang. Panduan AI AML dibagi menjadi lima bagian navigasi sebelah kiri yang sesuai dengan lima langkah berikut.
Langkah | Deskripsi |
---|---|
1. Menyiapkan AML AI | Pastikan project Google Cloud Anda siap menggunakan AI AML. Aktifkan layanan Google Cloud yang diperlukan dan siapkan logging dan kuota. Buat satu atau beberapa instance AML AI. |
2. Menyiapkan data untuk AML AI | Tinjau model dan skema data. Prioritaskan data yang akan disertakan. Kumpulkan dan ubah data inti perbankan, data investigasi risiko, dan data lain yang diperlukan. Membuat dan memvalidasi set data. |
3. Membuat model dan mengevaluasi performa | Memahami mesin, model, dan pengujian balik AI AML.
|
4. Membuat skor risiko dan penjelasannya | Daftarkan pelanggan perbankan retail dan komersial Anda. Gunakan model untuk
membuat skor risiko per pihak dan penjelasannya untuk:
|
5. Mempersiapkan model dan tata kelola risiko | Gabungkan output AML AI dari penyesuaian, pelatihan, evaluasi, dan prediksi dengan konsep AML dan dokumentasi produk untuk memenuhi persyaratan proses tata kelola risiko model Anda. |
Operasi teknis AI AML inti untuk membuat, menguji, dan men-deploy model adalah sebagai berikut. Langkah ini mendukung langkah 2-4 dalam tabel sebelumnya.
- Create AML AI Dataset - membuat kumpulan tabel data input BigQuery yang terstruktur untuk AML AI
- Konfigurasi Mesin - menyesuaikan mesin AML AI ke set data AML AI, termasuk penyesuaian hyperparameter
- Pelatihan Model - melatih model AML AI menggunakan Konfigurasi Mesin dan set data
- Pengujian balik - menguji model AI AML terhadap data historis di set data dan meringkas performa
- Register Parties - mendaftarkan pihak (pelanggan bank yang memiliki produk perbankan dan mengirim atau menerima transaksi) sehingga mereka dapat diberi skor dalam prediksi
- Prediksi - menghasilkan skor pihak dan penjelasan untuk digunakan dalam produksi
Konfigurasi Mesin, Pelatihan Model, Pengujian Ulang Model, dan Prediksi Model semuanya memerlukan set data AI AML sebagai input dan menampilkan artefak yang sesuai yang digunakan dalam operasi lain. Misalnya, Pelatihan Model menampilkan referensi ke model AI AML terlatih yang dapat digunakan untuk pengujian ulang atau prediksi. Untuk mengetahui detail teknis operasi, lihat Ringkasan Referensi REST.
Hierarki dependensi untuk proses AML AI
Pertimbangan penting saat menggunakan AI AML
Bagian ini dirancang untuk memberikan pengantar kepada pelanggan tentang konsep utama AML AI dan memberikan saran tentang beberapa praktik terbaik. Topik di sini dibahas secara lebih mendetail dalam panduan khusus dan link disediakan untuk bacaan lebih lanjut.
Konsistensi tanggal
AI AML menggunakan jangka waktu yang berbeda untuk operasi yang berbeda. Tanggal yang dipilih untuk setiap operasi harus diperhatikan dengan cermat untuk memastikan hasil yang andal. Secara khusus, untuk menghindari bias dalam hasil, penting agar bulan yang digunakan untuk melatih model AI AML tidak tumpang-tindih dengan bulan yang digunakan untuk pengujian balik.
Karena set data AI AML berisi data selama berbulan-bulan, set data dapat digunakan untuk beberapa operasi, bergantung pada pemilihan tanggal yang benar ini. Diagram berikut mengilustrasikan siklus pengembangan menggunakan AML AI, dengan jangka waktu yang berbeda dalam satu set data yang mencakup 42 bulan digunakan untuk mengonfigurasi mesin (penyesuaian hyperparameter), pelatihan, dan pengujian ulang. Semua proses ini menggunakan periode lihat balik yang memberikan konteks ke model, dan dapat tumpang-tindih dengan aman dengan data yang digunakan untuk operasi lain.
Untuk mengetahui informasi selengkapnya tentang set data AI AML dan periode waktu untuk berbagai operasi, lihat Memahami cakupan dan durasi data.
Untuk memastikan Anda mencatat perubahan pada data dari waktu ke waktu dengan benar, lihat Perubahan data dari waktu ke waktu.
Frekuensi batch produksi
Dalam prediksi, AML AI menghasilkan skor risiko AML berdasarkan bulan kalender. Pelanggan biasanya menggunakan AML AI sebagai bagian dari proses batch bulanan, dan mereka dianjurkan untuk menjalankan prediksi pada bulan dengan data transaksi lengkap sebanyak mungkin.
Konsistensi kolom
Seperti proses machine learning lainnya, data harus konsisten sebisa mungkin antara data pelatihan dan data pengujian. Jika kolom tidak diisi secara konsisten, perubahan tersebut dapat menyebabkan hasil yang tidak dapat diandalkan. Sebaiknya lakukan langkah-langkah untuk memastikan kolom diisi secara konsisten untuk setiap operasi dalam siklus pengembangan. Hal ini terutama berlaku jika set data yang berbeda digunakan untuk setiap operasi. Untuk mengetahui informasi selengkapnya, lihat konsistensi set data.
Konfigurasi mesin
Setelah konfigurasi mesin dibuat, biasanya tidak perlu membuatnya ulang untuk setiap set data baru atau dalam setiap siklus pengembangan. Hiperparameter yang dipilih dalam konfigurasi mesin untuk satu set data umumnya berperforma baik pada set data yang serupa.
Siklus pengembangan iteratif diilustrasikan dalam diagram berikut, sedangkan diagram sebelumnya menggunakan satu set data untuk operasi Pelatihan Model dan Uji Latihan.
Untuk informasi selengkapnya, lihat kapan harus menyesuaikan atau mewarisi.
Silsilah data
Sebagian besar kebijakan tata kelola model menentukan persyaratan untuk melacak silsilah data yang digunakan di semua operasi ML dari konfigurasi mesin, pelatihan, evaluasi, dan prediksi. Pelanggan bertanggung jawab untuk melacak silsilah data ini.
Sebaiknya gunakan ID unik dalam nama untuk semua data input, resource AI AML, dan data output untuk melacak garis keturunan di seluruh tahap. Hal ini membantu memastikan penautan yang kuat antara resource dalam operasi tertentu. Pelanggan juga dapat memberi label pada semua resource AML AI untuk memenuhi persyaratan lineage.
Selain itu, sebaiknya gunakan snapshot BigQuery dalam permintaan API untuk memastikan lineage data yang akurat.
Konfigurasi ini membantu menjawab pertanyaan seperti "dari mana konfigurasi mesin ini berasal?" dan "dari mana model ini berasal?" sekaligus membantu menyelidiki dan menyelesaikan insiden.
Untuk mengetahui detail cara membuat dan mengelola resource AI AML, lihat halaman REST API.