Halaman ini memberikan ringkasan pelatihan dengan algoritma bawaan. Dengan algoritma bawaan pada AI Platform Training, Anda dapat menjalankan tugas pelatihan pada data tanpa perlu menulis kode untuk aplikasi pelatihan. Anda dapat mengirimkan data pelatihan, memilih algoritme, lalu mengizinkan AI Platform Training untuk menangani pra-pemrosesan dan pelatihan untuk Anda. Setelah itu, sangat mudah untuk men-deploy model Anda dan mendapatkan prediksi pada Pelatihan AI Platform.
Cara kerja pelatihan dengan algoritma bawaan
AI Platform Training menjalankan tugas pelatihan Anda pada resource komputasi di cloud. Berikut adalah keseluruhan prosesnya:
- Bandingkan algoritma bawaan yang tersedia
untuk menentukan apakah algoritma tersebut sesuai dengan set data dan kasus penggunaan tertentu.
- Jika ya, pilih algoritme bawaan yang paling sesuai dengan kebutuhan Anda.
- Jika tidak ada algoritma bawaan yang cocok, Anda dapat membuat aplikasi pelatihan untuk dijalankan di AI Platform Training.
- Format data input Anda untuk pelatihan dengan algoritma bawaan. Anda harus mengirimkan data sebagai file CSV tanpa menghapus baris header-nya, dan kolom target harus ditetapkan sebagai kolom pertama. Jika berlaku, ikuti persyaratan pemformatan tambahan khusus untuk algoritma bawaan yang Anda gunakan.
- Buat bucket Cloud Storage tempat Pelatihan AI Platform dapat menyimpan output pelatihan, jika Anda belum memilikinya.
- Pilih opsi untuk menyesuaikan tugas pelatihan Anda. Pertama, buat pilihan untuk mengonfigurasi tugas pelatihan secara keseluruhan, lalu buat pilihan lebih lanjut untuk mengonfigurasi algoritme secara khusus. Secara opsional, Anda dapat membuat pilihan tambahan untuk mengonfigurasi penyesuaian hyperparameter untuk tugas Anda.
- Untuk tugas pelatihan secara keseluruhan, pilih nama tugas, algoritma bawaan yang akan digunakan, mesin yang akan digunakan, region tempat tugas harus dijalankan, dan lokasi bucket Cloud Storage tempat Anda ingin AI Platform Training menyimpan output pelatihan.
- Untuk pilihan khusus algoritme, Anda dapat mengaktifkan AI Platform Training untuk melakukan pra-pemrosesan otomatis pada set data Anda. Anda juga dapat menentukan argumen seperti kecepatan pemelajaran, langkah pelatihan, dan ukuran batch.
- Untuk penyesuaian hyperparameter, Anda dapat memilih metrik sasaran, seperti memaksimalkan akurasi prediktif model atau meminimalkan kerugian pelatihan. Selain itu, Anda dapat menyesuaikan hyperparameter tertentu dan menetapkan rentang untuk nilainya.
- Kirim tugas pelatihan, dan lihat log untuk memantau progres dan statusnya.
- Setelah tugas pelatihan Anda berhasil diselesaikan, Anda dapat men-deploy model terlatih Anda pada AI Platform Training untuk menyiapkan server prediksi dan mendapatkan prediksi tentang data baru.
Batasan
Perhatikan batasan berikut untuk pelatihan dengan algoritma bawaan:
- Pelatihan terdistribusi tidak didukung. Untuk menjalankan tugas pelatihan terdistribusi pada AI Platform Training, Anda harus membuat aplikasi pelatihan.
- Tugas pelatihan yang dikirimkan melalui konsol Google Cloud hanya menggunakan
jenis mesin lama. Anda dapat menggunakan jenis mesin Compute Engine dengan tugas pelatihan yang dikirimkan melalui
gcloud
atau Library Klien Google API untuk Python. Pelajari lebih lanjut jenis mesin untuk pelatihan. - GPU didukung untuk beberapa algoritma. Lihat perbandingan mendetail semua algoritma bawaan untuk mendapatkan informasi lebih lanjut.
- Mesin multi-GPU tidak menghasilkan kecepatan yang lebih tinggi dengan pelatihan algoritme bawaan. Jika Anda menggunakan GPU, pilih mesin dengan satu GPU.
- TPU tidak didukung untuk pelatihan algoritma bawaan berbentuk tabel. Anda harus membuat aplikasi pelatihan. Pelajari cara menjalankan tugas pelatihan dengan TPU.
Batasan lebih lanjut untuk algoritma bawaan tertentu dicatat dalam panduan yang sesuai untuk setiap algoritme.
Penyesuaian hyperparameter
Penyesuaian hyperparameter didukung untuk pelatihan dengan algoritma bawaan. Pertama, tentukan metrik sasaran, serta apakah akan meminimalkan atau memaksimalkannya. Anda dapat memaksimalkan akurasi model untuk klasifikasi, atau meminimalkan kerugian pelatihan. Kemudian, cantumkan hyperparameter yang ingin Anda sesuaikan, beserta nilai target untuk setiap hyperparameter.
Saat Anda mengirim tugas pelatihan dengan penyesuaian hyperparameter, Pelatihan AI Platform akan menjalankan beberapa uji coba, melacak, dan menyesuaikan hyperparameter setelah setiap uji coba. Saat tugas penyesuaian hyperparameter selesai, Pelatihan AI Platform akan melaporkan nilai untuk konfigurasi hyperparameter Anda yang paling efektif, serta ringkasan untuk setiap uji coba.
Pelajari penyelarasan hyperparameter pada Pelatihan AI Platform lebih lanjut.
Ringkasan algoritma
Algoritma bawaan membantu Anda melatih model untuk berbagai kasus penggunaan yang umumnya diselesaikan dengan klasifikasi dan regresi. Algoritma bawaan berikut tersedia untuk pelatihan tentang Pelatihan AI Platform:
- Pelajar linear
- Lebar dan dalam
- TabNet
- XGBoost
- Klasifikasi gambar
- Deteksi objek
Pelajar linear
Algoritma bawaan pelajar linear digunakan untuk regresi logistik, klasifikasi biner, dan klasifikasi kelas jamak. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.
Model pelajar linear menetapkan satu bobot ke setiap fitur input dan menjumlahkan bobotnya untuk memprediksi nilai target numerik. Untuk regresi logistik, nilai ini dikonversi menjadi nilai antara 0 dan 1. Jenis model sederhana ini mudah ditafsirkan, karena Anda dapat membandingkan bobot fitur untuk menentukan fitur input mana yang memiliki dampak signifikan pada prediksi Anda.
Pelajari cara kerja model linear skala besar lebih lanjut.
Lebar dan dalam
Algoritma bawaan yang luas dan mendalam digunakan untuk masalah klasifikasi dan regresi berskala besar, seperti masalah sistem pemberi rekomendasi, penelusuran, dan peringkat. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.
Jenis model ini menggabungkan model linear yang mempelajari dan "menghafal" berbagai aturan yang luas dengan jaringan neural dalam yang "menggeneralisasi" aturan dan menerapkannya dengan benar ke fitur serupa dalam data baru yang tidak terlihat.
Pelajari wide dan deep learning lebih lanjut.
TabNet
Algoritma bawaan TabNet digunakan untuk masalah klasifikasi dan regresi pada data tabel. AI Platform Training menggunakan implementasi berbasis TensorFlow.
Algoritma bawaan TabNet juga menyediakan atribusi fitur untuk membantu menafsirkan perilaku model, dan menjelaskan prediksinya.
Pelajari lebih lanjut tentang TabNet sebagai algoritma bawaan baru.
XGBoost
XGBoost (eXtreme Gradient Boosting) adalah framework yang menerapkan algoritma peningkatan gradien. XGBoost memungkinkan supervised learning yang efisien untuk tugas klasifikasi, regresi, dan peringkat. Pelatihan XGBoost didasarkan pada ansambel pohon keputusan, yang menggabungkan hasil model klasifikasi ganda dan regresi.
Pelajari lebih lanjut cara kerja XGBoost.
Klasifikasi gambar
Algoritma bawaan deteksi gambar menggunakan model klasifikasi gambar TensorFlow. Anda dapat melatih model klasifikasi image berdasarkan implementasi TensorFlow dari EfficientNet atau ResNet.
Deteksi objek
Algoritma bawaan deteksi objek menggunakan TensorFlow Object Detection API untuk membuat model yang dapat mengidentifikasi beberapa objek dalam satu gambar.
Membandingkan algoritma bawaan
Tabel berikut memberikan perbandingan singkat tentang algoritma bawaan:
Nama algoritma | Model ML yang digunakan | Jenis soal | Contoh kasus penggunaan | Akselerator yang didukung untuk pelatihan |
---|---|---|---|---|
Pembelajar linear | Estimator TensorFlow LinearClassifier dan LinearRegressor. |
Klasifikasi, regresi | Perkiraan penjualan | GPU |
Luas dan dalam | Estimator TensorFlow DNNLinearGabungkandClassifier, DNNLinearMergedEstimator, dan DNNLinearMergedRegressor. |
Klasifikasi, regresi, peringkat | Sistem rekomendasi, penelusuran | GPU |
TabNet | TensorFlow Estimator | Klasifikasi, regresi | Prediksi rasio klik-tayang (CTR) iklan, deteksi penipuan | GPU |
XGBoost | XGBoost | Klasifikasi, regresi | Prediksi rasio klik-tayang (CTR) iklan | GPU (hanya didukung oleh versi terdistribusi algoritma) |
Klasifikasi gambar | Model klasifikasi gambar TensorFlow | Klasifikasi | Mengklasifikasikan gambar | GPU, TPU |
Deteksi objek | TensorFlow Object Detection API | Deteksi objek | Mendeteksi objek dalam scene gambar yang kompleks | GPU, TPU |
Penampung algoritma
Saat mengirim tugas pelatihan ke AI Platform Training, Anda memilih algoritma dengan menentukan URI ke container Docker yang sesuai yang dihosting di Container Registry. Algoritma bawaan tersedia melalui penampung berikut:
Algoritma | URI Container Registry |
---|---|
Pelajar linear |
gcr.io/cloud-ml-algos/linear_learner_cpu:latest gcr.io/cloud-ml-algos/linear_learner_gpu:latest
|
Lebar dan dalam |
gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
|
TabNet |
gcr.io/cloud-ml-algos/tab_net:latest |
XGBoost |
gcr.io/cloud-ml-algos/boosted_trees:latest gcr.io/cloud-ml-algos/xgboost_dist:latest
|
Klasifikasi gambar |
gcr.io/cloud-ml-algos/image_classification:latest
|
Deteksi objek |
gcr.io/cloud-ml-algos/image_object_detection:latest
|
Langkah selanjutnya
- Pelajari cara AI Platform Training melakukan prapemrosesan data untuk pelatihan dengan algoritma bawaan.
- Coba tutorial memulai untuk pelatihan algoritma bawaan.