Mengonfigurasi engine

Halaman ini membahas konsep di balik konfigurasi mesin secara singkat.

Sumber yang didukung untuk hyperparameter

Saat mengonfigurasi mesin, Anda dapat memilih sumber hyperparameter yang digunakan untuk membuat model. Sumber berikut didukung:

  • Penyesuaian otomatis: AML AI menyesuaikan hyperparameter saat Anda membuat resource EngineConfig (perilaku default)
  • Waris: Waris hyperparameter dari konfigurasi mesin sebelumnya yang dibuat dengan versi mesin sebelumnya dalam versi penyesuaian yang sama. Setelan ini memungkinkan Anda menghindari penyesuaian ulang setiap kali menggunakan versi mesin model baru.

Kapan harus menyesuaikan atau mewarisi

Bagian berikut menguraikan kapan Anda harus memilih penyesuaian otomatis dan kapan Anda harus mewarisi hyperparameter dari konfigurasi mesin sebelumnya.

Kapan harus melakukan penyesuaian

Anda memiliki opsi untuk menyesuaikan setiap konfigurasi mesin baru dan, jika ragu, Anda harus selalu menyesuaikan untuk mendapatkan hasil performa terbaik. Lihat bagian Cara menyesuaikan mesin untuk mengetahui informasi selengkapnya.

Untuk performa terbaik, Anda harus mempertimbangkan penyesuaian mesin jika salah satu hal berikut terjadi:

  • Anda membuat perubahan signifikan pada logika set data. Misalnya, saat salah satu perubahan berikut:
    • Logika pengisian kolom
    • Pilihan kolom YANG DIREKOMENDASIKAN yang diisi
    • Logika atau pemilihan data yang diberikan dalam tabel PartySupplementaryData
  • Anda akan meminta mesin untuk melatih model untuk region baru.

Kapan harus mewarisi hyperparameter

Untuk menghemat waktu dan biaya saat mengadopsi versi mesin baru, Anda dapat mewarisi huperparameter dari mesin sebelumnya menggunakan versi penyesuaian yang sama. Lihat bagian Cara menggunakan versi mesin tanpa penyesuaian ulang.

Versi mesin dengan versi penyesuaian v003, dan versi mesin yang dirilis sebelum 22-02-2024, tidak mendukung pewarisan hyperparameter, tetapi versi ini dapat digunakan sebagai sumber hyperparameter.

Cara menyetel mesin

Untuk memicu penyesuaian, lihat Membuat dan mengelola konfigurasi mesin.

Secara khusus, Anda perlu memilih hal berikut:

  • Data yang akan digunakan untuk penyesuaian mesin:

    Tentukan set data dan waktu akhir dalam rentang tanggal set data.

    Penyesuaian mesin menggunakan label dan fitur berdasarkan bulan kalender lengkap hingga, tetapi tidak termasuk, bulan waktu akhir yang dipilih. Untuk mengetahui informasi selengkapnya, lihat Rentang waktu set data.

  • Versi mesin yang akan digunakan untuk penyesuaian mesin:

    Pilih versi mesin yang cocok dengan lini bisnis (retail atau komersial) yang akan menggunakan model terkait.

  • Volume investigasi yang Anda harapkan berdasarkan model:

    Tentukan partyInvestigationsPerPeriodHint Hal ini digunakan oleh penyesuaian mesin, pelatihan, dan pengujian ulang untuk memastikan AML AI memberikan performa pada volume investigasi bulanan Anda.

Output penyetelan mesin

Penyesuaian mesin menghasilkan resource EngineConfig, yang dapat digunakan untuk membuat resource Model.

Metadata konfigurasi mesin berisi metrik berikut. Secara khusus, metrik ini menunjukkan hal berikut:

  • Peningkatan performa yang diharapkan dari penyesuaian mesin dibandingkan menggunakan hyperparameter default

  • Pengukuran yang dapat digunakan untuk menilai konsistensi set data (misalnya, dengan membandingkan nilai ketidaklengkapan keluarga fitur dari operasi yang berbeda)

Nama metrik Deskripsi metrik Contoh nilai metrik
ExpectedRecallPreTuning Metrik recall yang diukur pada set pengujian saat menggunakan hyperparameter default dari versi mesin.

Pengukuran recall ini mengasumsikan jumlah investigasi per bulan yang ditentukan dalam partyInvestigationsPerPeriodHint.

{
  "recallValues": [
    {
      "partyInvestigationsPerPeriod": 5000,
      "recallValue": 0.72,
      "scoreThreshold": 0.42,
    },
  ],
}
ExpectedRecallPostTuning Metrik recall yang diukur pada set pengujian saat menggunakan hyperparameter yang disesuaikan.

Pengukuran recall ini mengasumsikan jumlah investigasi per bulan yang ditentukan dalam partyInvestigationsPerPeriodHint.

{
  "recallValues": [
    {
      "partyInvestigationsPerPeriod": 5000,
      "recallValue": 0.80,
      "scoreThreshold": 0.43,
    },
  ],
}
Ketidaklengkapan

Pangsa nilai yang tidak ada di semua fitur dalam setiap keluarga fitur.

Idealnya, semua keluarga fitur AI AML harus memiliki Missingness mendekati 0. Pengecualian dapat terjadi jika data yang mendasari grup fitur tersebut tidak tersedia untuk integrasi.

Perubahan yang signifikan pada nilai ini untuk setiap keluarga fitur antara penyesuaian, pelatihan, evaluasi, dan prediksi dapat menunjukkan inkonsistensi dalam set data yang digunakan.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}

Cara menggunakan versi mesin tanpa penyesuaian ulang

Untuk menggunakan kembali hyperparameter dari konfigurasi mesin sebelumnya, lihat bagian Membuat konfigurasi mesin yang mewarisi hyperparameter (di halaman Membuat dan mengelola konfigurasi mesin). Secara khusus, Anda perlu memilih hal berikut:

  • Jenis sumber hyperparameter: Pilih INHERITED sebagai hyperparameterSourceType. Jika Anda tidak menentukan jenis sumber, jenis sumber hyperparameter akan ditetapkan ke TUNING untuk memungkinkan kompatibilitas mundur.
  • Sumber hyperparameter: Tentukan nama resource lengkap konfigurasi mesin sumber dalam objek hyperparameterSource. Output dari konfigurasi mesin sumber digunakan untuk konfigurasi mesin baru. Konfigurasi mesin sumber harus dibuat dengan versi mesin sebelumnya dalam versi mesin penyesuaian yang sama dengan yang sekarang Anda gunakan.
  • Versi mesin yang akan digunakan untuk konfigurasi mesin: Pilih versi mesin yang cocok dengan lini bisnis (retail atau komersial) untuk model yang ingin Anda gunakan. Jika mewarisi hyperparameter, lini bisnis harus cocok dengan lini bisnis yang digunakan untuk sumber hyperparameter.

Output dan garis keturunan saat mewarisi

Dengan mewarisi hyperparameter dari versi mesin lain, Anda akan membuat resource EngineConfig yang dapat digunakan untuk membuat resource Model menggunakan hyperparameter dari konfigurasi mesin sumber.

Untuk garis keturunan, kolom berikut di resource EngineConfig ditetapkan sebagai berikut saat mewarisi hyperparameter dari konfigurasi mesin lain:

  • hyperparameterSourceType: INHERITED
  • hyperparameterSource: Konfigurasi mesin yang digunakan sebagai sumber hyperparameter
  • tuning: Objek tuning asli, termasuk referensi ke set data yang digunakan untuk penyesuaian mesin asli (primaryDataset) dan waktu terbaru saat data digunakan untuk membuat fitur untuk pelatihan (endTime)
  • performanceTarget: Objek performanceTarget asli, termasuk volume investigasi yang diharapkan berdasarkan model yang ditentukan (partyInvestigationsPerPeriodHint)
  • Metadata konfigurasi mesin dari penyesuaian mesin asli