Pengantar algoritma bawaan

Halaman ini memberikan ringkasan pelatihan dengan algoritma bawaan. Dengan algoritma bawaan pada AI Platform Training, Anda dapat menjalankan tugas pelatihan pada data tanpa perlu menulis kode untuk aplikasi pelatihan. Anda dapat mengirimkan data pelatihan, memilih algoritme, lalu mengizinkan AI Platform Training untuk menangani pra-pemrosesan dan pelatihan untuk Anda. Setelah itu, sangat mudah untuk men-deploy model Anda dan mendapatkan prediksi pada Pelatihan AI Platform.

Cara kerja pelatihan dengan algoritma bawaan

AI Platform Training menjalankan tugas pelatihan Anda pada resource komputasi di cloud. Berikut adalah keseluruhan prosesnya:

  1. Bandingkan algoritma bawaan yang tersedia untuk menentukan apakah algoritma tersebut sesuai dengan set data dan kasus penggunaan tertentu.
  2. Format data input Anda untuk pelatihan dengan algoritma bawaan. Anda harus mengirimkan data sebagai file CSV tanpa menghapus baris header-nya, dan kolom target harus ditetapkan sebagai kolom pertama. Jika berlaku, ikuti persyaratan pemformatan tambahan khusus untuk algoritma bawaan yang Anda gunakan.
  3. Buat bucket Cloud Storage tempat Pelatihan AI Platform dapat menyimpan output pelatihan, jika Anda belum memilikinya.
  4. Pilih opsi untuk menyesuaikan tugas pelatihan Anda. Pertama, buat pilihan untuk mengonfigurasi tugas pelatihan secara keseluruhan, lalu buat pilihan lebih lanjut untuk mengonfigurasi algoritme secara khusus. Secara opsional, Anda dapat membuat pilihan tambahan untuk mengonfigurasi penyesuaian hyperparameter untuk tugas Anda.
    • Untuk tugas pelatihan secara keseluruhan, pilih nama tugas, algoritma bawaan yang akan digunakan, mesin yang akan digunakan, region tempat tugas harus dijalankan, dan lokasi bucket Cloud Storage tempat Anda ingin AI Platform Training menyimpan output pelatihan.
    • Untuk pilihan khusus algoritme, Anda dapat mengaktifkan AI Platform Training untuk melakukan pra-pemrosesan otomatis pada set data Anda. Anda juga dapat menentukan argumen seperti kecepatan pemelajaran, langkah pelatihan, dan ukuran batch.
    • Untuk penyesuaian hyperparameter, Anda dapat memilih metrik sasaran, seperti memaksimalkan akurasi prediktif model atau meminimalkan kerugian pelatihan. Selain itu, Anda dapat menyesuaikan hyperparameter tertentu dan menetapkan rentang untuk nilainya.
  5. Kirim tugas pelatihan, dan lihat log untuk memantau progres dan statusnya.
  6. Setelah tugas pelatihan Anda berhasil diselesaikan, Anda dapat men-deploy model terlatih Anda pada AI Platform Training untuk menyiapkan server prediksi dan mendapatkan prediksi tentang data baru.

Batasan

Perhatikan batasan berikut untuk pelatihan dengan algoritma bawaan:

Batasan lebih lanjut untuk algoritma bawaan tertentu dicatat dalam panduan yang sesuai untuk setiap algoritme.

Penyesuaian hyperparameter

Penyesuaian hyperparameter didukung untuk pelatihan dengan algoritma bawaan. Pertama, tentukan metrik sasaran, serta apakah akan meminimalkan atau memaksimalkannya. Anda dapat memaksimalkan akurasi model untuk klasifikasi, atau meminimalkan kerugian pelatihan. Kemudian, cantumkan hyperparameter yang ingin Anda sesuaikan, beserta nilai target untuk setiap hyperparameter.

Saat Anda mengirim tugas pelatihan dengan penyesuaian hyperparameter, Pelatihan AI Platform akan menjalankan beberapa uji coba, melacak, dan menyesuaikan hyperparameter setelah setiap uji coba. Saat tugas penyesuaian hyperparameter selesai, Pelatihan AI Platform akan melaporkan nilai untuk konfigurasi hyperparameter Anda yang paling efektif, serta ringkasan untuk setiap uji coba.

Pelajari penyelarasan hyperparameter pada Pelatihan AI Platform lebih lanjut.

Ringkasan algoritma

Algoritma bawaan membantu Anda melatih model untuk berbagai kasus penggunaan yang umumnya diselesaikan dengan klasifikasi dan regresi. Algoritma bawaan berikut tersedia untuk pelatihan tentang Pelatihan AI Platform:

  • Pelajar linear
  • Lebar dan dalam
  • TabNet
  • XGBoost
  • Klasifikasi gambar
  • Deteksi objek

Pelajar linear

Algoritma bawaan pelajar linear digunakan untuk regresi logistik, klasifikasi biner, dan klasifikasi kelas jamak. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.

Model pelajar linear menetapkan satu bobot ke setiap fitur input dan menjumlahkan bobotnya untuk memprediksi nilai target numerik. Untuk regresi logistik, nilai ini dikonversi menjadi nilai antara 0 dan 1. Jenis model sederhana ini mudah ditafsirkan, karena Anda dapat membandingkan bobot fitur untuk menentukan fitur input mana yang memiliki dampak signifikan pada prediksi Anda.

Pelajari cara kerja model linear skala besar lebih lanjut.

Lebar dan dalam

Algoritma bawaan yang luas dan mendalam digunakan untuk masalah klasifikasi dan regresi berskala besar, seperti masalah sistem pemberi rekomendasi, penelusuran, dan peringkat. AI Platform Training menggunakan implementasi berdasarkan TensorFlow Estimator.

Jenis model ini menggabungkan model linear yang mempelajari dan "menghafal" berbagai aturan yang luas dengan jaringan neural dalam yang "menggeneralisasi" aturan dan menerapkannya dengan benar ke fitur serupa dalam data baru yang tidak terlihat.

Pelajari wide dan deep learning lebih lanjut.

TabNet

Algoritma bawaan TabNet digunakan untuk masalah klasifikasi dan regresi pada data tabel. AI Platform Training menggunakan implementasi berbasis TensorFlow.

Algoritma bawaan TabNet juga menyediakan atribusi fitur untuk membantu menafsirkan perilaku model, dan menjelaskan prediksinya.

Pelajari lebih lanjut tentang TabNet sebagai algoritma bawaan baru.

XGBoost

XGBoost (eXtreme Gradient Boosting) adalah framework yang menerapkan algoritma peningkatan gradien. XGBoost memungkinkan supervised learning yang efisien untuk tugas klasifikasi, regresi, dan peringkat. Pelatihan XGBoost didasarkan pada ansambel pohon keputusan, yang menggabungkan hasil model klasifikasi ganda dan regresi.

Pelajari lebih lanjut cara kerja XGBoost.

Klasifikasi gambar

Algoritma bawaan deteksi gambar menggunakan model klasifikasi gambar TensorFlow. Anda dapat melatih model klasifikasi image berdasarkan implementasi TensorFlow dari EfficientNet atau ResNet.

Deteksi objek

Algoritma bawaan deteksi objek menggunakan TensorFlow Object Detection API untuk membuat model yang dapat mengidentifikasi beberapa objek dalam satu gambar.

Membandingkan algoritma bawaan

Tabel berikut memberikan perbandingan singkat tentang algoritma bawaan:

Nama algoritma Model ML yang digunakan Jenis soal Contoh kasus penggunaan Akselerator yang didukung untuk pelatihan
Pembelajar linear Estimator TensorFlow
LinearClassifier dan LinearRegressor.
Klasifikasi, regresi Perkiraan penjualan GPU
Luas dan dalam Estimator TensorFlow
DNNLinearGabungkandClassifier, DNNLinearMergedEstimator, dan DNNLinearMergedRegressor.
Klasifikasi, regresi, peringkat Sistem rekomendasi, penelusuran GPU
TabNet TensorFlow Estimator Klasifikasi, regresi Prediksi rasio klik-tayang (CTR) iklan, deteksi penipuan GPU
XGBoost XGBoost Klasifikasi, regresi Prediksi rasio klik-tayang (CTR) iklan GPU (hanya didukung oleh versi terdistribusi algoritma)
Klasifikasi gambar Model klasifikasi gambar TensorFlow Klasifikasi Mengklasifikasikan gambar GPU, TPU
Deteksi objek TensorFlow Object Detection API Deteksi objek Mendeteksi objek dalam scene gambar yang kompleks GPU, TPU

Penampung algoritma

Saat mengirim tugas pelatihan ke AI Platform Training, Anda memilih algoritma dengan menentukan URI ke container Docker yang sesuai yang dihosting di Container Registry. Algoritma bawaan tersedia melalui penampung berikut:

Algoritma URI Container Registry
Pelajar linear gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
Lebar dan dalam gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
TabNet gcr.io/cloud-ml-algos/tab_net:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest
gcr.io/cloud-ml-algos/xgboost_dist:latest
Klasifikasi gambar gcr.io/cloud-ml-algos/image_classification:latest
Deteksi objek gcr.io/cloud-ml-algos/image_object_detection:latest

Langkah selanjutnya