Ringkasan pra-pemrosesan fitur
Pra-pemrosesan fitur adalah salah satu langkah terpenting dalam siklus proses machine learning. Proses ini terdiri dari membuat fitur dan membersihkan data pelatihan. Membuat fitur juga disebut sebagai rekayasa fitur.
BigQuery ML menyediakan teknik pra-pemrosesan fitur berikut:
Pra-pemrosesan otomatis. BigQuery ML melakukan pra-pemrosesan otomatis selama pelatihan. Untuk mengetahui informasi selengkapnya, lihat Pra-pemrosesan fitur otomatis.
Pra-pemrosesan manual. Anda dapat menggunakan klausa
TRANSFORM
dalam pernyataanCREATE MODEL
untuk menentukan pra-pemrosesan kustom menggunakan fungsi pra-pemrosesan manual. Anda juga dapat menggunakan fungsi ini di luar klausaTRANSFORM
untuk memproses data pelatihan sebelum membuat model.
Mendapatkan informasi fitur
Anda dapat menggunakan fungsi
ML.FEATURE_INFO
untuk
mengambil statistik semua kolom fitur input.
Artikel pusat informasi yang direkomendasikan
Dengan menggunakan setelan default dalam pernyataan CREATE MODEL
dan fungsi inferensi, Anda dapat membuat dan menggunakan model BigQuery ML bahkan tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang siklus proses pengembangan ML, seperti rekayasa fitur dan pelatihan model, akan membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan
pengetahuan tentang teknik dan proses ML:
- Kursus Singkat Machine Learning
- Pengantar Machine Learning
- Pembersihan Data
- Rekayasa Fitur
- Machine Learning Tingkat Menengah
Langkah berikutnya
Pelajari penayangan fitur di BigQuery ML.