Ringkasan pra-pemrosesan fitur
Pra-pemrosesan fitur adalah salah satu langkah terpenting dalam siklus proses machine learning. Proses ini terdiri dari membuat fitur dan membersihkan data pelatihan. Membuat fitur juga disebut sebagai rekayasa fitur.
BigQuery ML menyediakan teknik pra-pemrosesan fitur berikut:
Pra-pemrosesan otomatis. BigQuery ML melakukan pra-pemrosesan otomatis selama pelatihan. Untuk mengetahui informasi selengkapnya, lihat Pra-pemrosesan fitur otomatis.
Pra-pemrosesan manual. Anda dapat menggunakan klausa
TRANSFORM
dalam pernyataanCREATE MODEL
untuk menentukan pra-pemrosesan kustom menggunakan fungsi pra-pemrosesan manual. Anda juga dapat menggunakan fungsi ini di luar klausaTRANSFORM
untuk memproses data pelatihan sebelum membuat model.
Mendapatkan informasi fitur
Anda dapat menggunakan
fungsi ML.FEATURE_INFO
untuk
mengambil statistik semua kolom fitur input.
Informasi yang direkomendasikan
Dengan menggunakan setelan default dalam pernyataan CREATE MODEL
dan fungsi inferensi, Anda dapat membuat dan menggunakan model BigQuery ML meskipun tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang siklus proses pengembangan ML, seperti rekayasa fitur dan pelatihan model, akan membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan pemahaman tentang teknik dan proses ML:
- Kursus Singkat Machine Learning
- Pengantar Machine Learning
- Pembersihan Data
- Rekayasa Fitur
- Intermediate Machine Learning
Langkah berikutnya
- Pelajari penyajian fitur di BigQuery ML.
Untuk mengetahui informasi selengkapnya tentang pernyataan dan fungsi SQL yang didukung untuk model yang mendukung pra-pemrosesan fitur, lihat dokumen berikut: