Ringkasan pra-pemrosesan fitur

Pra-pemrosesan fitur adalah salah satu langkah terpenting dalam siklus proses machine learning. Proses ini terdiri dari membuat fitur dan membersihkan data pelatihan. Membuat fitur juga disebut sebagai rekayasa fitur.

BigQuery ML menyediakan teknik pra-pemrosesan fitur berikut:

  • Pra-pemrosesan otomatis. BigQuery ML melakukan pra-pemrosesan otomatis selama pelatihan. Untuk mengetahui informasi selengkapnya, lihat Pra-pemrosesan fitur otomatis.

  • Pra-pemrosesan manual. Anda dapat menggunakan klausa TRANSFORM dalam pernyataan CREATE MODEL untuk menentukan pra-pemrosesan kustom menggunakan fungsi pra-pemrosesan manual. Anda juga dapat menggunakan fungsi ini di luar klausa TRANSFORM untuk memproses data pelatihan sebelum membuat model.

Mendapatkan informasi fitur

Anda dapat menggunakan fungsi ML.FEATURE_INFO untuk mengambil statistik semua kolom fitur input.

Dengan menggunakan setelan default dalam pernyataan CREATE MODEL dan fungsi inferensi, Anda dapat membuat dan menggunakan model BigQuery ML bahkan tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang siklus proses pengembangan ML, seperti rekayasa fitur dan pelatihan model, akan membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan pengetahuan tentang teknik dan proses ML:

Langkah berikutnya

Pelajari penayangan fitur di BigQuery ML.