Menjalankan pipeline machine learning

AI Platform Pipelines menyediakan platform yang dapat Anda gunakan untuk mengotomatiskan alur kerja machine learning (ML) sebagai pipeline. Dengan menjalankan proses ML sebagai pipeline, Anda dapat:

  • Menjalankan pipeline secara ad hoc.
  • Jadwalkan operasi berulang, untuk melatih ulang model Anda secara rutin.
  • Bereksperimen dengan menjalankan pipeline Anda dengan kumpulan hyperparameter, jumlah langkah, atau iterasi pelatihan yang berbeda, dll. Kemudian, bandingkan hasil eksperimen Anda.

Panduan ini menjelaskan cara menjalankan pipeline dan menjadwalkan operasi berulang. Panduan ini juga menyediakan referensi yang dapat Anda gunakan untuk mempelajari lebih lanjut antarmuka pengguna Kubeflow Pipelines.

Sebelum memulai

Panduan ini menjelaskan cara menggunakan antarmuka pengguna Kubeflow Pipelines untuk menjalankan pipeline. Sebelum dapat menjalankan pipeline, Anda harus menyiapkan cluster AI Platform Pipelines dan memastikan bahwa Anda memiliki izin yang memadai untuk mengakses cluster AI Platform Pipelines.

Menjalankan pipeline ML

Gunakan petunjuk berikut untuk menjalankan pipeline ML di cluster AI Platform Pipelines Anda.

  1. Buka AI Platform Pipelines di konsol Google Cloud.

    Buka AI Platform Pipelines

  2. Klik Buka dasbor pipeline untuk cluster Kubeflow Pipelines Anda. Antarmuka pengguna Kubeflow Pipelines akan terbuka di tab baru.

  3. Di panel navigasi kiri, klik Pipelines.

  4. Klik nama pipeline yang ingin Anda jalankan. Jika Anda belum memuat pipeline, klik nama contoh pipeline seperti [Demo] TFX - Taxi Tip Prediction Model Trainer. Grafik yang menampilkan langkah-langkah dalam pipeline akan terbuka.

  5. Untuk menjalankan atau menjadwalkan pipeline, klik Create run. Formulir tempat Anda dapat memasukkan detail operasi akan terbuka.

  6. Sebelum menjalankan pipeline, Anda harus menentukan detail operasi, jenis operasi, dan parameter operasi.

    • Di bagian Run details, tentukan hal berikut:

      1. Pipeline: Pilih pipeline yang ingin Anda jalankan.
      2. Versi Pipeline: Pilih versi pipeline yang ingin Anda jalankan.
      3. Run name: Masukkan nama unik untuk operasi ini. Anda dapat menggunakan nama tersebut untuk menemukan operasi ini nanti.
      4. Deskripsi: (Opsional) Masukkan deskripsi untuk memberikan informasi selengkapnya tentang operasi ini.
      5. Eksperimen: (Opsional) Untuk mengelompokkan operasi terkait, pilih eksperimen.
    • Di bagian Jenis operasi, tunjukkan seberapa sering operasi ini harus dijalankan.

      1. Pilih apakah ini adalah operasi Satu kali atau Berulang.
      2. Jika ini adalah proses berulang, tentukan pemicu proses:

        1. Jenis pemicu: Pilih apakah operasi ini dipicu secara berkala, atau berdasarkan jadwal cron.
        2. Maximum concurrent runs: Masukkan jumlah maksimum operasi yang dapat aktif sekaligus.
        3. Memiliki tanggal mulai: Centang Memiliki tanggal mulai, lalu masukkan Tanggal mulai dan Waktu mulai untuk menentukan kapan pemicu ini harus mulai membuat operasi.
        4. Memiliki tanggal akhir: Centang Memiliki tanggal akhir, lalu masukkan Tanggal akhir dan Waktu akhir untuk menentukan kapan pemicu ini harus berhenti membuat operasi.
        5. Jalankan setiap: Pilih frekuensi untuk memicu operasi baru. Jika operasi ini dipicu berdasarkan jadwal cron, centang Izinkan pengeditan ekspresi cron untuk memasukkan ekspresi cron secara langsung.
    • Di Run parameters, sesuaikan parameter pipeline untuk operasi ini. Anda dapat menggunakan parameter untuk menetapkan nilai seperti jalur untuk memuat data pelatihan atau menyimpan artefak, hyperparameter, jumlah iterasi pelatihan, dll. Parameter pipeline ditentukan saat pipeline dibuat.

      Jika Anda menjalankan pipeline [Demo] TFX - Taxi Tip Prediction Model Trainer, tentukan hal berikut:

      1. pipeline-root: Parameter pipeline-root menentukan tempat output pipeline harus disimpan. Pipeline ini menyimpan artefak operasi ke bucket Cloud Storage default AI Platform Pipelines.

        Anda dapat mengganti nilai ini untuk menentukan jalur ke bucket Cloud Storage lain yang dapat diakses cluster Anda. Pelajari lebih lanjut cara membuat bucket Cloud Storage.

      2. data-root: Parameter data-root menentukan jalur ke data pelatihan pipeline. Gunakan nilai default.

      3. module-file: Parameter module-file menentukan jalur ke kode sumber untuk modul yang digunakan dalam pipeline ini. Gunakan nilai default.

        Dengan memuat kode dari bucket Cloud Storage, Anda dapat mengubah perilaku komponen dengan cepat tanpa mem-build ulang image container komponen.

  7. Klik Mulai. Dasbor pipeline menampilkan daftar operasi pipeline.

  8. Klik nama operasi Anda dalam daftar operasi pipeline. Grafik sesi lari Anda akan ditampilkan. Saat operasi masih berlangsung, grafik akan berubah saat setiap langkah dijalankan.

  9. Klik langkah pipeline untuk menjelajahi input, output, log, dan sebagainya dari operasi Anda.

Memahami antarmuka pengguna Kubeflow Pipelines

Gunakan referensi berikut untuk mempelajari lebih lanjut antarmuka pengguna Kubeflow Pipelines.

Langkah selanjutnya