Pra-pemrosesan fitur manual

Anda dapat menggunakan klausa TRANSFORM dari pernyataan CREATE MODEL bersama dengan fungsi pra-pemrosesan manual untuk menentukan pra-pemrosesan data kustom. Anda juga dapat menggunakan fungsi pra-pemrosesan manual ini di luar klausa TRANSFORM.

Jika ingin memisahkan pra-pemrosesan data dari pelatihan model, Anda dapat membuat model khusus transformasi yang hanya melakukan transformasi data menggunakan klausa TRANSFORM.

Anda dapat menggunakan fungsi ML.TRANSFORM untuk meningkatkan transparansi pra-pemrosesan fitur. Dengan fungsi ini, Anda dapat menampilkan data yang telah diproses sebelumnya dari klausa TRANSFORM model, sehingga Anda dapat melihat data pelatihan aktual yang dimasukkan ke dalam pelatihan model, serta data prediksi sebenarnya yang disertakan dalam penyaluran model.

Untuk mengetahui informasi tentang dukungan pra-pemrosesan fitur di BigQuery ML, lihat Ringkasan pra-pemrosesan fitur.

Untuk mengetahui informasi tentang pernyataan dan fungsi SQL yang didukung untuk setiap jenis model, lihat Perjalanan pengguna menyeluruh untuk setiap model.

Jenis fungsi pra-pemrosesan

Ada beberapa jenis fungsi pra-pemrosesan manual:

  • Fungsi skalar beroperasi pada satu baris. Contohnya, ML.BUCKETIZE.
  • Fungsi bernilai tabel beroperasi di semua baris dan menghasilkan tabel. Contohnya, ML.FEATURES_AT_TIME.
  • Fungsi analisis beroperasi di semua baris, dan menampilkan hasilnya untuk setiap baris berdasarkan statistik yang dikumpulkan di semua baris. Contohnya, ML.QUANTILE_BUCKETIZE.

    Anda harus selalu menggunakan klausa OVER() kosong dengan fungsi analisis ML.

    Saat Anda menggunakan fungsi analisis ML di dalam klausa TRANSFORM selama pelatihan, statistik yang sama akan otomatis diterapkan pada input dalam prediksi.

Bagian berikut menjelaskan fungsi pra-pemrosesan yang tersedia.

Fungsi umum

Gunakan fungsi berikut pada string atau ekspresi numerik untuk membersihkan data:

Fungsi numerik

Gunakan fungsi berikut pada ekspresi numerik untuk regularisasi data:

Fungsi kategoris

Gunakan fungsi berikut dalam mengategorikan data:

Fungsi teks

Gunakan fungsi berikut pada ekspresi string teks:

Fungsi gambar

Gunakan fungsi berikut pada data gambar:

Batasan umum