Pengantar algoritma bawaan

Halaman ini memberikan ringkasan pelatihan dengan algoritma bawaan. Dengan algoritma bawaan di AI Platform Training, Anda dapat menjalankan tugas pelatihan pada data tanpa menulis kode apa pun untuk aplikasi pelatihan. Anda dapat mengirimkan data pelatihan, memilih algoritma, lalu mengizinkan AI Platform Training untuk menangani prapemrosesan dan pelatihan untuk Anda. Setelah itu, Anda dapat dengan mudah men-deploy model dan mendapatkan prediksi di AI Platform Training.

Cara kerja pelatihan dengan algoritme bawaan

AI Platform Training menjalankan tugas pelatihan Anda pada resource komputasi di cloud. Berikut adalah keseluruhan prosesnya:

  1. Bandingkan algoritma bawaan yang tersedia untuk menentukan apakah algoritma tersebut sesuai dengan set data dan kasus penggunaan tertentu Anda.
  2. Format data input Anda untuk pelatihan dengan algoritma bawaan. Anda harus mengirimkan data sebagai file CSV dengan baris header dihapus, dan kolom target harus ditetapkan sebagai kolom pertama. Jika ada, ikuti persyaratan pemformatan tambahan yang khusus untuk algoritma bawaan yang Anda gunakan.
  3. Buat bucket Cloud Storage tempat AI Platform Training dapat menyimpan output pelatihan, jika Anda belum memilikinya.
  4. Pilih opsi untuk menyesuaikan tugas pelatihan Anda. Pertama, buat pilihan untuk mengonfigurasi tugas pelatihan secara keseluruhan, lalu buat pilihan lebih lanjut untuk mengonfigurasi algoritma secara khusus. Secara opsional, Anda dapat membuat pilihan tambahan untuk mengonfigurasi penyesuaian hyperparameter untuk tugas Anda.
    • Untuk tugas pelatihan secara keseluruhan, pilih nama tugas, algoritma bawaan yang akan digunakan, mesin yang akan digunakan, region tempat tugas harus berjalan, dan lokasi bucket Cloud Storage tempat Anda ingin AI Platform Training menyimpan output pelatihan.
    • Untuk pilihan khusus algoritma, Anda dapat mengaktifkan Pelatihan AI Platform untuk melakukan prapemrosesan otomatis pada set data Anda. Anda juga dapat menentukan argumen seperti kecepatan pembelajaran, langkah pelatihan, dan ukuran batch.
    • Untuk penyesuaian hyperparameter, Anda dapat memilih metrik sasaran, seperti memaksimalkan akurasi prediktif model atau meminimalkan loss pelatihan. Selain itu, Anda dapat menyesuaikan hyperparameter tertentu dan menetapkan rentang untuk nilainya.
  5. Kirim tugas pelatihan, dan lihat log untuk memantau progres dan statusnya.
  6. Setelah tugas pelatihan berhasil diselesaikan, Anda dapat men-deploy model terlatih di AI Platform Training untuk menyiapkan server prediksi dan mendapatkan prediksi pada data baru.

Batasan

Perhatikan batasan berikut untuk pelatihan dengan algoritma bawaan:

  • Pelatihan terdistribusi tidak didukung. Untuk menjalankan tugas pelatihan terdistribusi di AI Platform Training, Anda harus membuat aplikasi pelatihan.
  • Tugas pelatihan yang dikirimkan melalui konsol Google Cloud hanya menggunakan jenis mesin lama. Anda dapat menggunakan jenis mesin Compute Engine dengan tugas pelatihan yang dikirim melalui gcloud atau Library Klien Google API untuk Python. Pelajari lebih lanjut jenis mesin untuk pelatihan.
  • GPU didukung untuk beberapa algoritma. Lihat perbandingan semua algoritma bawaan yang mendetail untuk mengetahui informasi selengkapnya.
  • Mesin multi-GPU tidak menghasilkan kecepatan yang lebih tinggi dengan pelatihan algoritma bawaan. Jika Anda menggunakan GPU, pilih mesin dengan satu GPU.
  • TPU tidak didukung untuk pelatihan algoritma bawaan tabel. Anda harus membuat aplikasi pelatihan. Pelajari cara menjalankan tugas pelatihan dengan TPU.

Batasan lebih lanjut untuk algoritma bawaan tertentu akan dicatat dalam panduan untuk setiap algoritma yang sesuai.

Penyesuaian hyperparameter

Penyesuaian hyperparameter didukung untuk pelatihan dengan algoritma bawaan. Pertama, tentukan metrik sasaran, serta apakah akan meminimalkan atau memaksimalkan metrik tersebut. Anda dapat memaksimalkan akurasi model untuk klasifikasi, atau meminimalkan kerugian pelatihan. Kemudian, cantumkan hyperparameter yang ingin Anda sesuaikan, beserta nilai target untuk setiap hyperparameter.

Saat Anda mengirimkan tugas pelatihan dengan penyesuaian hyperparameter, Pelatihan AI Platform akan menjalankan beberapa uji coba, melacak, dan menyesuaikan hyperparameter setelah setiap uji coba. Saat tugas penyesuaian hyperparameter selesai, Pelatihan AI Platform melaporkan nilai untuk konfigurasi paling efektif dari hyperparameter Anda, serta ringkasan untuk setiap uji coba.

Pelajari lebih lanjut penyesuaian hyperparameter di AI Platform Training.

Ringkasan algoritma

Algoritma bawaan membantu Anda melatih model untuk berbagai kasus penggunaan yang umumnya dipecahkan dengan klasifikasi dan regresi. Algoritma bawaan berikut tersedia untuk pelatihan di AI Platform Training:

  • Linear learner
  • Lebar dan dalam
  • TabNet
  • XGBoost
  • Klasifikasi gambar
  • Deteksi objek

Linear learner

Algoritma bawaan pembelajar linear digunakan untuk regresi logistik, klasifikasi biner, dan klasifikasi multi-class. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.

Model pembelajar linear menetapkan satu bobot untuk setiap fitur input dan menjumlahkan bobot untuk memprediksi nilai target numerik. Untuk regresi logistik, nilai ini dikonversi menjadi nilai antara 0 dan 1. Jenis model sederhana ini mudah diinterpretasikan, karena Anda dapat membandingkan bobot fitur untuk menentukan fitur input mana yang memiliki dampak signifikan pada prediksi Anda.

Pelajari lebih lanjut cara kerja model linear skala besar.

Lebar dan dalam

Algoritma bawaan yang luas dan mendalam digunakan untuk masalah klasifikasi dan regresi berskala besar, seperti sistem rekomendasi, penelusuran, dan masalah peringkat. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.

Jenis model ini menggabungkan model linear yang mempelajari dan "mengingat" berbagai aturan luas dengan jaringan neural dalam yang "memgeneralisasi" aturan dan menerapkan aturan tersebut dengan benar ke fitur serupa dalam data baru yang belum pernah dilihat.

Pelajari lebih lanjut pembelajaran luas dan mendalam.

TabNet

Algoritma bawaan TabNet digunakan untuk masalah klasifikasi dan regresi pada data tabel. AI Platform Training menggunakan implementasi berdasarkan TensorFlow.

Algoritma bawaan TabNet juga menyediakan atribusi fitur untuk membantu menafsirkan perilaku model, dan menjelaskan prediksinya.

Pelajari lebih lanjut TabNet sebagai algoritma bawaan baru.

XGBoost

XGBoost (eXtreme Gradient Boosting) adalah framework yang menerapkan algoritma peningkatan gradien. XGBoost memungkinkan pembelajaran terpandu yang efisien untuk tugas klasifikasi, regresi, dan peringkat. Pelatihan XGBoost didasarkan pada ansambel pohon keputusan, yang menggabungkan hasil dari beberapa model klasifikasi dan regresi.

Pelajari lebih lanjut cara kerja XGBoost.

Klasifikasi gambar

Algoritma bawaan deteksi gambar menggunakan model klasifikasi gambar TensorFlow. Anda dapat melatih model klasifikasi gambar berdasarkan implementasi TensorFlow dari EfficientNet atau ResNet.

Deteksi objek

Algoritma bawaan deteksi objek menggunakan TensorFlow Object Detection API untuk membuat model yang dapat mengidentifikasi beberapa objek dalam satu gambar.

Membandingkan algoritma bawaan

Tabel berikut memberikan perbandingan cepat algoritma bawaan:

Nama algoritma Model ML yang digunakan Jenis masalah Contoh kasus penggunaan Akselerator yang didukung untuk pelatihan
Pembelajar linear TensorFlow Estimator
LinearClassifier dan LinearRegressor.
Klasifikasi, regresi Perkiraan penjualan GPU
Wide and deep TensorFlow Estimator
DNNLinearCombinedClassifier, DNNLinearCombinedEstimator, dan DNNLinearCombinedRegressor.
Klasifikasi, regresi, peringkat Sistem rekomendasi, penelusuran GPU
TabNet TensorFlow Estimator Klasifikasi, regresi Prediksi rasio klik-tayang (CTR) iklan, deteksi penipuan GPU
XGBoost XGBoost Klasifikasi, regresi Prediksi rasio klik-tayang (CTR) iklan GPU (hanya didukung oleh versi algoritma yang didistribusikan)
Klasifikasi gambar Model klasifikasi gambar TensorFlow Klasifikasi Mengklasifikasikan gambar GPU, TPU
Deteksi objek TensorFlow Object Detection API Deteksi objek Mendeteksi objek dalam tampilan gambar yang kompleks GPU, TPU

Penampung algoritma

Saat mengirimkan tugas pelatihan ke AI Platform Training, Anda memilih algoritma dengan menentukan URI ke penampung Docker yang sesuai yang dihosting di Container Registry. Algoritma bawaan tersedia melalui penampung berikut:

Algoritme URI Container Registry
Linear learner gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
Lebar dan dalam gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
TabNet gcr.io/cloud-ml-algos/tab_net:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest
gcr.io/cloud-ml-algos/xgboost_dist:latest
Klasifikasi gambar gcr.io/cloud-ml-algos/image_classification:latest
Deteksi objek gcr.io/cloud-ml-algos/image_object_detection:latest

Langkah selanjutnya