Halaman ini memberikan ringkasan pelatihan dengan algoritma bawaan. Dengan algoritma bawaan di AI Platform Training, Anda dapat menjalankan tugas pelatihan pada data tanpa menulis kode apa pun untuk aplikasi pelatihan. Anda dapat mengirimkan data pelatihan, memilih algoritma, lalu mengizinkan AI Platform Training untuk menangani prapemrosesan dan pelatihan untuk Anda. Setelah itu, Anda dapat dengan mudah men-deploy model dan mendapatkan prediksi di AI Platform Training.
Cara kerja pelatihan dengan algoritme bawaan
AI Platform Training menjalankan tugas pelatihan Anda pada resource komputasi di cloud. Berikut adalah keseluruhan prosesnya:
- Bandingkan algoritma bawaan yang tersedia
untuk menentukan apakah algoritma tersebut sesuai dengan set data dan kasus penggunaan tertentu Anda.
- Jika ya, pilih algoritma bawaan yang paling sesuai dengan kebutuhan Anda.
- Jika tidak ada algoritma bawaan yang sesuai, Anda dapat membuat aplikasi pelatihan untuk dijalankan di Pelatihan AI Platform.
- Format data input Anda untuk pelatihan dengan algoritma bawaan. Anda harus mengirimkan data sebagai file CSV dengan baris header dihapus, dan kolom target harus ditetapkan sebagai kolom pertama. Jika ada, ikuti persyaratan pemformatan tambahan yang khusus untuk algoritma bawaan yang Anda gunakan.
- Buat bucket Cloud Storage tempat AI Platform Training dapat menyimpan output pelatihan, jika Anda belum memilikinya.
- Pilih opsi untuk menyesuaikan tugas pelatihan Anda. Pertama, buat pilihan untuk mengonfigurasi tugas pelatihan secara keseluruhan, lalu buat pilihan lebih lanjut untuk mengonfigurasi algoritma secara khusus. Secara opsional, Anda dapat membuat
pilihan tambahan untuk mengonfigurasi penyesuaian hyperparameter untuk tugas Anda.
- Untuk tugas pelatihan secara keseluruhan, pilih nama tugas, algoritma bawaan yang akan digunakan, mesin yang akan digunakan, region tempat tugas harus berjalan, dan lokasi bucket Cloud Storage tempat Anda ingin AI Platform Training menyimpan output pelatihan.
- Untuk pilihan khusus algoritma, Anda dapat mengaktifkan Pelatihan AI Platform untuk melakukan prapemrosesan otomatis pada set data Anda. Anda juga dapat menentukan argumen seperti kecepatan pembelajaran, langkah pelatihan, dan ukuran batch.
- Untuk penyesuaian hyperparameter, Anda dapat memilih metrik sasaran, seperti memaksimalkan akurasi prediktif model atau meminimalkan loss pelatihan. Selain itu, Anda dapat menyesuaikan hyperparameter tertentu dan menetapkan rentang untuk nilainya.
- Kirim tugas pelatihan, dan lihat log untuk memantau progres dan statusnya.
- Setelah tugas pelatihan berhasil diselesaikan, Anda dapat men-deploy model terlatih di AI Platform Training untuk menyiapkan server prediksi dan mendapatkan prediksi pada data baru.
Batasan
Perhatikan batasan berikut untuk pelatihan dengan algoritma bawaan:
- Pelatihan terdistribusi tidak didukung. Untuk menjalankan tugas pelatihan terdistribusi di AI Platform Training, Anda harus membuat aplikasi pelatihan.
- Tugas pelatihan yang dikirimkan melalui konsol Google Cloud hanya menggunakan
jenis mesin lama. Anda dapat menggunakan jenis mesin Compute Engine dengan tugas pelatihan yang dikirim melalui
gcloud
atau Library Klien Google API untuk Python. Pelajari lebih lanjut jenis mesin untuk pelatihan. - GPU didukung untuk beberapa algoritma. Lihat perbandingan semua algoritma bawaan yang mendetail untuk mengetahui informasi selengkapnya.
- Mesin multi-GPU tidak menghasilkan kecepatan yang lebih tinggi dengan pelatihan algoritma bawaan. Jika Anda menggunakan GPU, pilih mesin dengan satu GPU.
- TPU tidak didukung untuk pelatihan algoritma bawaan tabel. Anda harus membuat aplikasi pelatihan. Pelajari cara menjalankan tugas pelatihan dengan TPU.
Batasan lebih lanjut untuk algoritma bawaan tertentu akan dicatat dalam panduan untuk setiap algoritma yang sesuai.
Penyesuaian hyperparameter
Penyesuaian hyperparameter didukung untuk pelatihan dengan algoritma bawaan. Pertama, tentukan metrik sasaran, serta apakah akan meminimalkan atau memaksimalkan metrik tersebut. Anda dapat memaksimalkan akurasi model untuk klasifikasi, atau meminimalkan kerugian pelatihan. Kemudian, cantumkan hyperparameter yang ingin Anda sesuaikan, beserta nilai target untuk setiap hyperparameter.
Saat Anda mengirimkan tugas pelatihan dengan penyesuaian hyperparameter, Pelatihan AI Platform akan menjalankan beberapa uji coba, melacak, dan menyesuaikan hyperparameter setelah setiap uji coba. Saat tugas penyesuaian hyperparameter selesai, Pelatihan AI Platform melaporkan nilai untuk konfigurasi paling efektif dari hyperparameter Anda, serta ringkasan untuk setiap uji coba.
Pelajari lebih lanjut penyesuaian hyperparameter di AI Platform Training.
Ringkasan algoritma
Algoritma bawaan membantu Anda melatih model untuk berbagai kasus penggunaan yang umumnya dipecahkan dengan klasifikasi dan regresi. Algoritma bawaan berikut tersedia untuk pelatihan di AI Platform Training:
- Linear learner
- Lebar dan dalam
- TabNet
- XGBoost
- Klasifikasi gambar
- Deteksi objek
Linear learner
Algoritma bawaan pembelajar linear digunakan untuk regresi logistik, klasifikasi biner, dan klasifikasi multi-class. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.
Model pembelajar linear menetapkan satu bobot untuk setiap fitur input dan menjumlahkan bobot untuk memprediksi nilai target numerik. Untuk regresi logistik, nilai ini dikonversi menjadi nilai antara 0 dan 1. Jenis model sederhana ini mudah diinterpretasikan, karena Anda dapat membandingkan bobot fitur untuk menentukan fitur input mana yang memiliki dampak signifikan pada prediksi Anda.
Pelajari lebih lanjut cara kerja model linear skala besar.
Lebar dan dalam
Algoritma bawaan yang luas dan mendalam digunakan untuk masalah klasifikasi dan regresi berskala besar, seperti sistem rekomendasi, penelusuran, dan masalah peringkat. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.
Jenis model ini menggabungkan model linear yang mempelajari dan "mengingat" berbagai aturan luas dengan jaringan neural dalam yang "memgeneralisasi" aturan dan menerapkan aturan tersebut dengan benar ke fitur serupa dalam data baru yang belum pernah dilihat.
Pelajari lebih lanjut pembelajaran luas dan mendalam.
TabNet
Algoritma bawaan TabNet digunakan untuk masalah klasifikasi dan regresi pada data tabel. AI Platform Training menggunakan implementasi berdasarkan TensorFlow.
Algoritma bawaan TabNet juga menyediakan atribusi fitur untuk membantu menafsirkan perilaku model, dan menjelaskan prediksinya.
Pelajari lebih lanjut TabNet sebagai algoritma bawaan baru.
XGBoost
XGBoost (eXtreme Gradient Boosting) adalah framework yang menerapkan algoritma peningkatan gradien. XGBoost memungkinkan pembelajaran terpandu yang efisien untuk tugas klasifikasi, regresi, dan peringkat. Pelatihan XGBoost didasarkan pada ansambel pohon keputusan, yang menggabungkan hasil dari beberapa model klasifikasi dan regresi.
Pelajari lebih lanjut cara kerja XGBoost.
Klasifikasi gambar
Algoritma bawaan deteksi gambar menggunakan model klasifikasi gambar TensorFlow. Anda dapat melatih model klasifikasi gambar berdasarkan implementasi TensorFlow dari EfficientNet atau ResNet.
Deteksi objek
Algoritma bawaan deteksi objek menggunakan TensorFlow Object Detection API untuk membuat model yang dapat mengidentifikasi beberapa objek dalam satu gambar.
Membandingkan algoritma bawaan
Tabel berikut memberikan perbandingan cepat algoritma bawaan:
Nama algoritma | Model ML yang digunakan | Jenis masalah | Contoh kasus penggunaan | Akselerator yang didukung untuk pelatihan |
---|---|---|---|---|
Pembelajar linear | TensorFlow Estimator LinearClassifier dan LinearRegressor. |
Klasifikasi, regresi | Perkiraan penjualan | GPU |
Wide and deep | TensorFlow Estimator DNNLinearCombinedClassifier, DNNLinearCombinedEstimator, dan DNNLinearCombinedRegressor. |
Klasifikasi, regresi, peringkat | Sistem rekomendasi, penelusuran | GPU |
TabNet | TensorFlow Estimator | Klasifikasi, regresi | Prediksi rasio klik-tayang (CTR) iklan, deteksi penipuan | GPU |
XGBoost | XGBoost | Klasifikasi, regresi | Prediksi rasio klik-tayang (CTR) iklan | GPU (hanya didukung oleh versi algoritma yang didistribusikan) |
Klasifikasi gambar | Model klasifikasi gambar TensorFlow | Klasifikasi | Mengklasifikasikan gambar | GPU, TPU |
Deteksi objek | TensorFlow Object Detection API | Deteksi objek | Mendeteksi objek dalam tampilan gambar yang kompleks | GPU, TPU |
Penampung algoritma
Saat mengirimkan tugas pelatihan ke AI Platform Training, Anda memilih algoritma dengan menentukan URI ke penampung Docker yang sesuai yang dihosting di Container Registry. Algoritma bawaan tersedia melalui penampung berikut:
Algoritme | URI Container Registry |
---|---|
Linear learner |
gcr.io/cloud-ml-algos/linear_learner_cpu:latest gcr.io/cloud-ml-algos/linear_learner_gpu:latest
|
Lebar dan dalam |
gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
|
TabNet |
gcr.io/cloud-ml-algos/tab_net:latest |
XGBoost |
gcr.io/cloud-ml-algos/boosted_trees:latest gcr.io/cloud-ml-algos/xgboost_dist:latest
|
Klasifikasi gambar |
gcr.io/cloud-ml-algos/image_classification:latest
|
Deteksi objek |
gcr.io/cloud-ml-algos/image_object_detection:latest
|
Langkah selanjutnya
- Pelajari cara AI Platform Training memproses data Anda terlebih dahulu untuk pelatihan dengan algoritma bawaan.
- Coba tutorial memulai untuk pelatihan algoritma bawaan.