Halaman ini membahas konsep di balik konfigurasi mesin secara singkat.
Sumber yang didukung untuk hyperparameter
Saat mengonfigurasi mesin, Anda dapat memilih sumber hyperparameter yang digunakan untuk membuat model. Sumber berikut didukung:
- Penyesuaian otomatis: AML AI menyesuaikan hyperparameter saat Anda membuat resource EngineConfig (perilaku default)
- Waris: Waris hyperparameter dari konfigurasi mesin sebelumnya yang dibuat dengan versi mesin sebelumnya dalam versi penyesuaian yang sama. Setelan ini memungkinkan Anda menghindari penyesuaian ulang setiap kali menggunakan versi mesin model baru.
Kapan harus menyesuaikan atau mewarisi
Bagian berikut menguraikan kapan Anda harus memilih penyesuaian otomatis dan kapan Anda harus mewarisi hyperparameter dari konfigurasi mesin sebelumnya.
Kapan harus melakukan penyesuaian
Anda memiliki opsi untuk menyesuaikan setiap konfigurasi mesin baru dan, jika ragu, Anda harus selalu menyesuaikan untuk mendapatkan hasil performa terbaik. Lihat bagian Cara menyesuaikan mesin untuk mengetahui informasi selengkapnya.
Untuk performa terbaik, Anda harus mempertimbangkan penyesuaian mesin jika salah satu hal berikut terjadi:
- Anda membuat perubahan signifikan pada logika set data. Misalnya, saat salah satu
perubahan berikut:
- Logika pengisian kolom
- Pilihan kolom YANG DIREKOMENDASIKAN yang diisi
- Logika atau pemilihan data yang diberikan dalam tabel PartySupplementaryData
- Anda akan meminta mesin untuk melatih model untuk region baru.
Kapan harus mewarisi hyperparameter
Untuk menghemat waktu dan biaya saat mengadopsi versi mesin baru, Anda dapat mewarisi huperparameter dari mesin sebelumnya menggunakan versi penyesuaian yang sama. Lihat bagian Cara menggunakan versi mesin tanpa penyesuaian ulang.
Versi mesin dengan versi penyesuaian v003, dan versi mesin yang dirilis sebelum 22-02-2024, tidak mendukung pewarisan hyperparameter, tetapi versi ini dapat digunakan sebagai sumber hyperparameter.
Cara menyetel mesin
Untuk memicu penyesuaian, lihat Membuat dan mengelola konfigurasi mesin.
Secara khusus, Anda perlu memilih hal berikut:
Data yang akan digunakan untuk penyesuaian mesin:
Tentukan set data dan waktu akhir dalam rentang tanggal set data.
Penyesuaian mesin menggunakan label dan fitur berdasarkan bulan kalender lengkap hingga, tetapi tidak termasuk, bulan waktu akhir yang dipilih. Untuk mengetahui informasi selengkapnya, lihat Rentang waktu set data.
Versi mesin yang akan digunakan untuk penyesuaian mesin:
Pilih versi mesin yang cocok dengan lini bisnis (retail atau komersial) yang akan menggunakan model terkait.
Volume investigasi yang Anda harapkan berdasarkan model:
Tentukan
partyInvestigationsPerPeriodHint
Hal ini digunakan oleh penyesuaian mesin, pelatihan, dan pengujian ulang untuk memastikan AML AI memberikan performa pada volume investigasi bulanan Anda.
Output penyetelan mesin
Penyesuaian mesin menghasilkan resource EngineConfig, yang dapat digunakan untuk membuat resource Model.
Metadata konfigurasi mesin berisi metrik berikut. Secara khusus, metrik ini menunjukkan hal berikut:
Peningkatan performa yang diharapkan dari penyesuaian mesin dibandingkan menggunakan hyperparameter default
Pengukuran yang dapat digunakan untuk menilai konsistensi set data (misalnya, dengan membandingkan nilai ketidaklengkapan keluarga fitur dari operasi yang berbeda)
Nama metrik | Deskripsi metrik | Contoh nilai metrik |
---|---|---|
ExpectedRecallPreTuning | Metrik recall yang diukur pada set pengujian saat menggunakan
hyperparameter default dari versi mesin.
Pengukuran recall ini mengasumsikan jumlah investigasi per bulan
yang ditentukan dalam |
{ "recallValues": [ { "partyInvestigationsPerPeriod": 5000, "recallValue": 0.72, "scoreThreshold": 0.42, }, ], } |
ExpectedRecallPostTuning | Metrik recall yang diukur pada set pengujian saat menggunakan hyperparameter yang disesuaikan.
Pengukuran recall ini mengasumsikan jumlah investigasi per bulan
yang ditentukan dalam |
{ "recallValues": [ { "partyInvestigationsPerPeriod": 5000, "recallValue": 0.80, "scoreThreshold": 0.43, }, ], } |
Ketidaklengkapan |
Pangsa nilai yang tidak ada di semua fitur dalam setiap keluarga fitur. Idealnya, semua keluarga fitur AI AML harus memiliki Missingness mendekati 0. Pengecualian dapat terjadi jika data yang mendasari grup fitur tersebut tidak tersedia untuk integrasi. Perubahan yang signifikan pada nilai ini untuk setiap keluarga fitur antara penyesuaian, pelatihan, evaluasi, dan prediksi dapat menunjukkan inkonsistensi dalam set data yang digunakan. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Cara menggunakan versi mesin tanpa penyesuaian ulang
Untuk menggunakan kembali hyperparameter dari konfigurasi mesin sebelumnya, lihat bagian Membuat konfigurasi mesin yang mewarisi hyperparameter (di halaman Membuat dan mengelola konfigurasi mesin). Secara khusus, Anda perlu memilih hal berikut:
- Jenis sumber hyperparameter: Pilih
INHERITED
sebagaihyperparameterSourceType
. Jika Anda tidak menentukan jenis sumber, jenis sumber hyperparameter akan ditetapkan keTUNING
untuk memungkinkan kompatibilitas mundur. - Sumber hyperparameter: Tentukan nama resource lengkap konfigurasi mesin
sumber dalam objek
hyperparameterSource
. Output dari konfigurasi mesin sumber digunakan untuk konfigurasi mesin baru. Konfigurasi mesin sumber harus dibuat dengan versi mesin sebelumnya dalam versi mesin penyesuaian yang sama dengan yang sekarang Anda gunakan. - Versi mesin yang akan digunakan untuk konfigurasi mesin: Pilih versi mesin yang cocok dengan lini bisnis (retail atau komersial) untuk model yang ingin Anda gunakan. Jika mewarisi hyperparameter, lini bisnis harus cocok dengan lini bisnis yang digunakan untuk sumber hyperparameter.
Output dan garis keturunan saat mewarisi
Dengan mewarisi hyperparameter dari versi mesin lain, Anda akan membuat resource EngineConfig yang dapat digunakan untuk membuat resource Model menggunakan hyperparameter dari konfigurasi mesin sumber.
Untuk garis keturunan, kolom berikut di resource EngineConfig ditetapkan sebagai berikut saat mewarisi hyperparameter dari konfigurasi mesin lain:
hyperparameterSourceType
:INHERITED
hyperparameterSource
: Konfigurasi mesin yang digunakan sebagai sumber hyperparametertuning
: Objektuning
asli, termasuk referensi ke set data yang digunakan untuk penyesuaian mesin asli (primaryDataset
) dan waktu terbaru saat data digunakan untuk membuat fitur untuk pelatihan (endTime
)performanceTarget
: ObjekperformanceTarget
asli, termasuk volume investigasi yang diharapkan berdasarkan model yang ditentukan (partyInvestigationsPerPeriodHint
)- Metadata konfigurasi mesin dari penyesuaian mesin asli