Memilih metode pelatihan

Dokumen ini menjelaskan perbedaan utama antara melatih model di Vertex AI menggunakan AutoML atau melatih model kustom dan melatih model menggunakan BigQuery ML.

Dengan AutoML, Anda dapat membuat dan melatih model dengan sedikit upaya teknis. Anda dapat menggunakan AutoML untuk membuat prototipe model dengan cepat dan mempelajari set data baru sebelum berinvestasi dalam pengembangan. Misalnya, Anda dapat menggunakannya untuk mempelajari fitur yang terbaik untuk set data tertentu.

Dengan pelatihan kustom, Anda dapat membuat aplikasi pelatihan yang dioptimalkan untuk hasil yang Anda targetkan. Anda memiliki kontrol penuh atas fungsionalitas aplikasi pelatihan. Artinya, Anda dapat menargetkan objektif apa pun, menggunakan algoritma apa pun, mengembangkan fungsi atau metrik kerugian Anda sendiri, atau melakukan penyesuaian lainnya.

Dengan BigQuery ML, Anda dapat melatih model menggunakan data BigQuery langsung di BigQuery. Dengan menggunakan perintah SQL, Anda dapat dengan cepat membuat model dan menggunakannya untuk mendapatkan prediksi batch.

Untuk membandingkan berbagai fungsi dan keahlian yang diperlukan untuk setiap layanan, tinjau tabel berikut.

AutoML Pelatihan kustom BigQuery ML
Diperlukan keahlian data science Tidak Ya, untuk mengembangkan aplikasi pelatihan dan juga melakukan beberapa persiapan data seperti rekayasa fitur. Tidak.
Diperlukan kemampuan pemrograman Tidak, AutoML tidak memerlukan kode. Ya, untuk mengembangkan aplikasi pelatihan. Kemampuan pemrograman SQL yang diperlukan untuk membangun, mengevaluasi, dan menggunakan model di BigQuery ML.
Waktu untuk pelatihan model Lebih sedikit. Memerlukan lebih sedikit persiapan data dan tidak memerlukan pengembangan. Lebih banyak. Memerlukan lebih banyak persiapan data dan memerlukan pengembangan aplikasi pelatihan. Lebih sedikit. Kecepatan pengembangan model meningkat karena Anda tidak perlu membangun infrastruktur yang diperlukan untuk prediksi batch atau pelatihan model, karena BigQuery ML memanfaatkan mesin komputasi BigQuery. Hal ini dapat meningkatkan kecepatan pelatihan, evaluasi, dan prediksi.
Batas untuk tujuan machine learning Ya, Anda harus menargetkan salah satu tujuan yang telah ditentukan AutoML. Tidak Ya.
Dapat mengoptimalkan performa model secara manual dengan penyesuaian hyperparameter Tidak. AutoML melakukan beberapa penyesuaian hyperparameter otomatis, tetapi Anda tidak dapat mengubah nilai yang digunakan. Ya. Anda dapat menyesuaikan model dalam setiap pelatihan yang dijalankan untuk eksperimen dan perbandingan. Ya. BigQuery ML mendukung penyesuaian hyperparameter saat melatih model ML menggunakan pernyataan `CREATE MODEL`.
Dapat mengontrol aspek lingkungan pelatihan Terbatas. Untuk set data gambar dan tabular, Anda dapat menentukan jumlah jam kerja node yang akan dilatih, dan apakah Anda mengizinkan penghentian awal untuk pelatihan atau tidak. Ya. Anda dapat menentukan aspek lingkungan seperti jenis mesin Compute Engine, ukuran disk, framework machine learning, dan jumlah node. Tidak.
Batas untuk ukuran data

Ya. AutoML menggunakan set data terkelola. Batas ukuran data bervariasi bergantung pada jenis set data. Lihat salah satu topik berikut untuk mengetahui detailnya:

Tidak untuk set data yang tidak dikelola. Set data terkelola memiliki batas yang sama dengan objek set data terkelola yang dibuat dan dihosting oleh Vertex AI serta digunakan untuk melatih model AutoML. Ya. BigQuery ML menerapkan kuota yang sesuai per project. Untuk mempelajari lebih lanjut, lihat Kuota dan batas.

Langkah selanjutnya