Versi lama AI Platform Training ini tidak digunakan lagi dan tidak akan tersedia lagi di Google Cloud setelah 31 Januari 2025. Migrasikan resource Anda ke pelatihan kustom Vertex AI untuk mendapatkan fitur machine learning baru yang tidak tersedia di AI Platform.

Halaman ini diterjemahkan oleh Cloud Translation API.

Pengantar algoritma bawaan

Halaman ini memberikan ringkasan pelatihan dengan algoritma bawaan. Dengan algoritma bawaan di AI Platform Training, Anda dapat menjalankan tugas pelatihan pada data tanpa menulis kode apa pun untuk aplikasi pelatihan. Anda dapat mengirimkan data pelatihan, memilih algoritma, lalu mengizinkan AI Platform Training untuk menangani prapemrosesan dan pelatihan untuk Anda. Setelah itu, Anda dapat dengan mudah men-deploy model dan mendapatkan prediksi di AI Platform Training.

Cara kerja pelatihan dengan algoritme bawaan

AI Platform Training menjalankan tugas pelatihan Anda pada resource komputasi di cloud. Berikut adalah keseluruhan prosesnya:

Bandingkan algoritma bawaan yang tersedia untuk menentukan apakah algoritma tersebut sesuai dengan set data dan kasus penggunaan tertentu.
- Jika ya, pilih algoritma bawaan yang paling sesuai dengan kebutuhan Anda.
- Jika tidak ada algoritma bawaan yang sesuai, Anda dapat membuat aplikasi pelatihan untuk dijalankan di Pelatihan AI Platform.
Format data input Anda untuk pelatihan dengan algoritma bawaan. Anda harus mengirimkan data sebagai file CSV dengan baris header dihapus, dan kolom target harus ditetapkan sebagai kolom pertama. Jika berlaku, ikuti persyaratan pemformatan tambahan yang khusus untuk algoritma bawaan yang Anda gunakan.
Buat bucket Cloud Storage tempat AI Platform Training dapat menyimpan output pelatihan, jika Anda belum memilikinya.
Pilih opsi untuk menyesuaikan tugas pelatihan Anda. Pertama, buat pilihan untuk mengonfigurasi tugas pelatihan secara keseluruhan, lalu buat pilihan lebih lanjut untuk mengonfigurasi algoritma secara khusus. Secara opsional, Anda dapat membuat pilihan tambahan untuk mengonfigurasi penyesuaian hyperparameter untuk tugas Anda.
- Untuk tugas pelatihan secara keseluruhan, pilih nama tugas, algoritma bawaan yang akan digunakan, mesin yang akan digunakan, region tempat tugas akan dijalankan, dan lokasi bucket Cloud Storage tempat Anda ingin AI Platform Training menyimpan output pelatihan.
- Untuk pemilihan khusus algoritma, Anda dapat mengaktifkan Pelatihan AI Platform untuk melakukan prapemrosesan otomatis pada set data Anda. Anda juga dapat menentukan argumen seperti kecepatan pembelajaran, langkah pelatihan, dan ukuran batch.
- Untuk penyesuaian hyperparameter, Anda dapat memilih metrik sasaran, seperti memaksimalkan akurasi prediktif model atau meminimalkan loss pelatihan. Selain itu, Anda dapat menyesuaikan hyperparameter tertentu dan menetapkan rentang untuk nilainya.
Kirim tugas pelatihan, dan lihat log untuk memantau progres dan statusnya.
Setelah tugas pelatihan berhasil diselesaikan, Anda dapat men-deploy model terlatih di AI Platform Training untuk menyiapkan server prediksi dan mendapatkan prediksi pada data baru.

Batasan

Perhatikan batasan berikut untuk pelatihan dengan algoritma bawaan:

Pelatihan terdistribusi tidak didukung. Untuk menjalankan tugas pelatihan terdistribusi di AI Platform Training, Anda harus membuat aplikasi pelatihan.
Tugas pelatihan yang dikirimkan melalui konsol Google Cloud hanya menggunakan jenis mesin lama. Anda dapat menggunakan jenis mesin Compute Engine dengan tugas pelatihan yang dikirim melalui gcloud atau Library Klien Google API untuk Python. Pelajari lebih lanjut jenis mesin untuk pelatihan.
GPU didukung untuk beberapa algoritma. Lihat perbandingan semua algoritma bawaan yang mendetail untuk mengetahui informasi selengkapnya.
Mesin multi-GPU tidak menghasilkan kecepatan yang lebih tinggi dengan pelatihan algoritma bawaan. Jika Anda menggunakan GPU, pilih mesin dengan satu GPU.
TPU tidak didukung untuk pelatihan algoritma bawaan tabel. Anda harus membuat aplikasi pelatihan. Pelajari cara menjalankan tugas pelatihan dengan TPU.

Batasan lebih lanjut untuk algoritma bawaan tertentu akan dicatat dalam panduan untuk setiap algoritma yang sesuai.

Penyesuaian hyperparameter

Penyesuaian hyperparameter didukung untuk pelatihan dengan algoritma bawaan. Pertama, tentukan metrik sasaran, serta apakah akan meminimalkan atau memaksimalkan metrik tersebut. Anda dapat memaksimalkan akurasi model untuk klasifikasi, atau meminimalkan kerugian pelatihan. Kemudian, cantumkan hyperparameter yang ingin Anda sesuaikan, beserta nilai target untuk setiap hyperparameter.

Saat Anda mengirimkan tugas pelatihan dengan penyesuaian hyperparameter, Pelatihan AI Platform akan menjalankan beberapa uji coba, melacak, dan menyesuaikan hyperparameter setelah setiap uji coba. Saat tugas penyesuaian hyperparameter selesai, Pelatihan AI Platform melaporkan nilai untuk konfigurasi paling efektif dari hyperparameter Anda, serta ringkasan untuk setiap uji coba.

Pelajari lebih lanjut penyesuaian hyperparameter di AI Platform Training.

Ringkasan algoritma

Algoritma bawaan membantu Anda melatih model untuk berbagai kasus penggunaan yang umumnya dipecahkan dengan klasifikasi dan regresi. Algoritma bawaan berikut tersedia untuk pelatihan di AI Platform Training:

Linear learner
Lebar dan dalam
TabNet
XGBoost
Klasifikasi gambar
Deteksi objek

Linear learner

Algoritma bawaan pembelajar linear digunakan untuk regresi logistik, klasifikasi biner, dan klasifikasi multi-class. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.

Model pembelajar linear menetapkan satu bobot untuk setiap fitur input dan menjumlahkan bobot untuk memprediksi nilai target numerik. Untuk regresi logistik, nilai ini dikonversi menjadi nilai antara 0 dan 1. Jenis model sederhana ini mudah diinterpretasikan, karena Anda dapat membandingkan bobot fitur untuk menentukan fitur input mana yang memiliki dampak signifikan pada prediksi Anda.

Pelajari lebih lanjut cara kerja model linear skala besar.

Lebar dan dalam

Algoritma bawaan yang luas dan mendalam digunakan untuk masalah klasifikasi dan regresi berskala besar, seperti sistem rekomendasi, penelusuran, dan masalah peringkat. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.

Jenis model ini menggabungkan model linear yang mempelajari dan "mengingat" berbagai aturan luas dengan jaringan neural dalam yang "memgeneralisasi" aturan dan menerapkan aturan tersebut dengan benar ke fitur serupa dalam data baru yang belum pernah dilihat.

Pelajari lebih lanjut pembelajaran luas dan mendalam.

TabNet

Algoritma bawaan TabNet digunakan untuk masalah klasifikasi dan regresi pada data tabel. AI Platform Training menggunakan implementasi berdasarkan TensorFlow.

Algoritma bawaan TabNet juga menyediakan atribusi fitur untuk membantu menafsirkan perilaku model, dan menjelaskan prediksinya.

Pelajari lebih lanjut TabNet sebagai algoritma bawaan baru.

XGBoost

XGBoost (eXtreme Gradient Boosting) adalah framework yang menerapkan algoritma peningkatan gradien. XGBoost memungkinkan pembelajaran terpandu yang efisien untuk tugas klasifikasi, regresi, dan peringkat. Pelatihan XGBoost didasarkan pada ansambel pohon keputusan, yang menggabungkan hasil dari beberapa model klasifikasi dan regresi.

Pelajari lebih lanjut cara kerja XGBoost.

Klasifikasi gambar

Algoritma bawaan deteksi gambar menggunakan model klasifikasi gambar TensorFlow. Anda dapat melatih model klasifikasi gambar berdasarkan implementasi TensorFlow dari EfficientNet atau ResNet.

Deteksi objek

Algoritma bawaan deteksi objek menggunakan TensorFlow Object Detection API untuk membuat model yang dapat mengidentifikasi beberapa objek dalam satu gambar.

Membandingkan algoritma bawaan

Tabel berikut memberikan perbandingan cepat algoritma bawaan:

Nama algoritma	Model ML yang digunakan	Jenis masalah	Contoh kasus penggunaan	Akselerator yang didukung untuk pelatihan
Pembelajar linear	TensorFlow Estimator LinearClassifier dan LinearRegressor.	Klasifikasi, regresi	Perkiraan penjualan	GPU
Wide and deep	TensorFlow Estimator DNNLinearCombinedClassifier, DNNLinearCombinedEstimator, dan DNNLinearCombinedRegressor.	Klasifikasi, regresi, peringkat	Sistem rekomendasi, penelusuran	GPU
TabNet	TensorFlow Estimator	Klasifikasi, regresi	Prediksi rasio klik-tayang (CTR) iklan, deteksi penipuan	GPU
XGBoost	XGBoost	Klasifikasi, regresi	Prediksi rasio klik-tayang (CTR) iklan	GPU (hanya didukung oleh versi algoritma yang didistribusikan)
Klasifikasi gambar	Model klasifikasi gambar TensorFlow	Klasifikasi	Mengklasifikasikan gambar	GPU, TPU
Deteksi objek	TensorFlow Object Detection API	Deteksi objek	Mendeteksi objek dalam tampilan gambar yang kompleks	GPU, TPU

Penampung algoritma

Saat mengirimkan tugas pelatihan ke AI Platform Training, Anda memilih algoritma dengan menentukan URI ke penampung Docker yang sesuai yang dihosting di Container Registry. Algoritma bawaan tersedia melalui penampung berikut:

Algoritma	URI Container Registry
Linear learner	`gcr.io/cloud-ml-algos/linear_learner_cpu:latest` `gcr.io/cloud-ml-algos/linear_learner_gpu:latest`
Lebar dan dalam	`gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest` `gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest`
TabNet	`gcr.io/cloud-ml-algos/tab_net:latest`
XGBoost	`gcr.io/cloud-ml-algos/boosted_trees:latest` `gcr.io/cloud-ml-algos/xgboost_dist:latest`
Klasifikasi gambar	`gcr.io/cloud-ml-algos/image_classification:latest`
Deteksi objek	`gcr.io/cloud-ml-algos/image_object_detection:latest`

Langkah selanjutnya

Pelajari cara AI Platform Training memproses data Anda terlebih dahulu untuk pelatihan dengan algoritma bawaan.
Coba tutorial memulai untuk pelatihan algoritma bawaan.

Berikutnya

Pra-pemrosesan data untuk algoritma bawaan tabular