Mengelola model dan tugas

Selama proses pelatihan dan deployment model serta mendapatkan prediksi, Anda perlu mengelola resource di Google Cloud Platform. Halaman ini menjelaskan cara menggunakan model, versi, dan tugas.

Memberi nama resource AI Platform Prediction

Anda harus menentukan nama untuk setiap tugas yang Anda buat. Aturan penamaan konsisten di ketiga jenis resource. Masing-masing nama:

  • Hanya boleh berisi huruf, angka, dan garis bawah.
  • Peka huruf besar/kecil
  • Harus diawali dengan huruf.
  • Tidak boleh lebih dari 128 karakter.
  • Harus unik dalam namespace-nya (project Anda untuk model dan tugas, model induk untuk versi).

Anda harus membuat nama yang mudah dibedakan dalam daftar resource, seperti log tugas. Berikut beberapa saran:

  • Beri nama semua tugas untuk model yang sama menggunakan nama model dan indeks tugas (stempel waktu saat tugas dibuat berfungsi dengan baik).
  • Beri nama model agar mudah diidentifikasi berdasarkan set data yang digunakan (census_wide_deep biasanya lebih baik daripada my_new_model, misalnya).
  • Versi akan lebih baik jika mudah dibaca. Sebaiknya gunakan penentu versi sederhana seperti v1, bukan stempel waktu atau nilai unik yang serupa.

Mengelola model

Resource model Anda di AI Platform Prediction adalah penampung logis untuk setiap implementasi model machine learning Anda. Ini adalah resource termudah untuk digunakan karena tidak memiliki operasi kompleks atau resource tambahan untuk dialokasikan dan dikelola.

Tabel berikut meringkas operasi model dan mencantumkan antarmuka yang dapat Anda gunakan untuk menjalankannya:

Operasi Antarmuka Catatan
buat projects.models.create
gcloud ai-platform models create
Create Model di halaman AI Platform Prediction Models.
delete projects.models.delete

Menghapus model adalah operasi yang berjalan lama.

Model tidak boleh memiliki versi yang terkait sebelum Anda dapat menghapusnya.

gcloud ai-platform models delete
Hapus di daftar Model, atau di halaman Detail model.
get projects.models.get

Informasi yang Anda dapatkan dijelaskan dalam referensi resource Model.

gcloud ai-platform models describe
Halaman Model details (masuk dengan link dari daftar Models.
list projects.models.list
gcloud ai-platform models list
Halaman Model Prediksi AI Platform.

Mengelola versi

Versi Anda adalah iterasi tertentu dari model Anda. Inti dari versi model adalah TensorFlow SavedModel.

Tabel berikut merangkum operasi versi dan mencantumkan antarmuka yang dapat Anda gunakan untuk menjalankannya:

Operasi Antarmuka Catatan
buat projects.models.versions.create

Membuat versi adalah men-deploy SavedModel ke AI Platform Prediction. Lihat panduan deployment model untuk informasi selengkapnya.

gcloud ai-platform versions create
Create Version di halaman Model details (masuk dengan link dari daftar Models).
delete projects.models.versions.delete

Menghapus versi adalah operasi yang berjalan lama.

Anda tidak dapat menghapus versi default model kecuali jika versi tersebut adalah satu-satunya versi yang ditetapkan ke model tersebut.

gcloud ai-platform versions delete
Hapus di daftar Versi di halaman Detail model.
get projects.models.versions.get

Informasi yang Anda dapatkan dijelaskan dalam referensi resource Version.

gcloud ai-platform versions describe
Halaman Detail versi (dari link dalam daftar Versi di halaman Detail model.
list projects.models.versions.list
gcloud ai-platform versions list
Daftar Versions di halaman Model details.
setDefault projects.models.versions.setDefault

Ini adalah satu-satunya cara untuk menetapkan versi default baru untuk model; setelah versi pertama, membuat versi tidak akan menjadikan versi baru sebagai default.

gcloud ai-platform versions set-default
Tetapkan sebagai default pada daftar Versi di halaman Detail model.

Mengelola tugas

AI Platform Prediction mendukung dua jenis tugas: pelatihan dan prediksi batch. Detail untuk setiap operasi berbeda, tetapi operasi dasarnya sama.

Tabel berikut merangkum operasi tugas dan mencantumkan antarmuka yang dapat Anda gunakan untuk menjalankannya:

Operasi Antarmuka Catatan
buat projects.jobs.create

Pembuatan tugas dijelaskan secara mendetail dalam panduan pelatihan dan prediksi batch.

gcloud ai-platform jobs submit training

gcloud ai-platform jobs submit prediction

Tidak ada penerapan konsol.
batal projects.jobs.cancel

Membatalkan tugas yang sedang berjalan.

gcloud ai-platform jobs cancel

Cancel di halaman Job details.
get projects.jobs.get Informasi yang Anda dapatkan dijelaskan dalam referensi resource Jobs.

gcloud ai-platform jobs describe

Halaman Detail tugas (masuk dengan link dari daftar Tugas).
list projects.jobs.list Hanya tugas yang dibuat dalam 90 hari terakhir yang akan ditampilkan.

gcloud ai-platform jobs list

Daftar Pekerjaan.

Menangani operasi asinkron

Sebagian besar operasi pengelolaan resource AI Platform Prediction ditampilkan sesegera mungkin, dan memberikan respons lengkap. Namun, ada dua jenis operasi asinkron yang harus Anda pahami: tugas dan operasi yang berjalan lama.

Saat memulai operasi asinkron, Anda biasanya ingin mengetahui kapan operasi tersebut selesai. Proses untuk mendapatkan status berbeda untuk tugas dan operasi yang berjalan lama:

Mendapatkan status tugas

Anda dapat menggunakan projects.jobs.get untuk mendapatkan status tugas. Metode ini juga disediakan sebagai gcloud ai-platform jobs describe dan di halaman Tugas di konsol Google Cloud. Terlepas dari cara Anda mendapatkan status, informasi ini didasarkan pada anggota resource Tugas. Anda akan mengetahui bahwa tugas telah selesai jika Job.state dalam respons sama dengan salah satu nilai berikut:

  • SUCCEEDED
  • FAILED
  • CANCELLED

Mendapatkan status operasi yang berjalan lama

AI Platform Prediction memiliki tiga operasi yang berjalan lama:

  • Membuat versi
  • Menghapus model
  • Menghapus versi

Dari operasi yang berjalan lama, hanya pembuatan versi yang mungkin memerlukan waktu yang lama untuk diselesaikan. Penghapusan model dan versi biasanya dilakukan dalam hampir real time.

Jika Anda membuat versi menggunakan Google Cloud CLI atau Konsol Google Cloud, antarmuka akan otomatis memberi tahu Anda saat operasi selesai. Jika membuat versi dengan API, Anda dapat melacak status operasi sendiri:

  1. Dapatkan nama operasi yang ditetapkan layanan dari objek Operation dalam respons terhadap panggilan Anda ke projects.models.versions.create. Kunci untuk nilai nama adalah "name".

  2. Gunakan projects.operations.get untuk melakukan polling status operasi secara berkala.

    1. Gunakan nama operasi dari langkah pertama untuk membentuk string nama dari formulir:

      'projects/my_project/operations/operation_name'
      

      Pesan respons berisi objek Operation.

    2. Dapatkan nilai untuk kunci "done". Ini adalah indikator Boolean untuk selesainya operasi. Benar jika operasi selesai.

  3. Objek Operation akan menyertakan salah satu dari dua kunci setelah selesai:

    • Kunci "response" ada jika operasi berhasil. Nilainya harus berupa google.protobuf.Empty, karena tidak ada operasi jangka panjang AI Platform Prediction yang memiliki objek respons.

    • Kunci "error" ada jika terjadi error. Nilainya adalah objek Status.

Langkah selanjutnya