Fungsi ML.IMPUTER
Dokumen ini menjelaskan fungsi ML.IMPUTER
, yang memungkinkan Anda mengganti
nilai NULL
dalam string atau ekspresi numerik. Anda dapat mengganti nilai NULL
dengan nilai yang paling sering digunakan untuk ekspresi string, atau
nilai rata-rata atau
median untuk ekspresi numerik.
Saat digunakan dalam
klausa TRANSFORM
,
nilai yang dihitung selama pelatihan untuk nilai rata-rata, median, dan nilai yang paling
sering digunakan secara otomatis digunakan dalam prediksi.
Sintaks
ML.IMPUTER(expression, strategy) OVER()
Argumen
ML.IMPUTER
menggunakan argumen berikut:
expression
: ekspresi numerik atauSTRING
yang akan diterapkan.strategy
: nilaiSTRING
yang menentukan cara mengganti nilaiNULL
. Nilai yang valid adalah sebagai berikut:mean
: rata-rata dariexpression
. Anda hanya dapat menggunakan nilai ini dengan ekspresi numerik.median
: medianexpression
. Anda hanya dapat menggunakan nilai ini dengan ekspresi numerik.most_frequent
: nilai paling sering diexpression
.
Output
ML.IMPUTER
menampilkan nilai FLOAT64
(untuk ekspresi numerik) atau STRING
(untuk ekspresi string) yang berisi pengganti untuk
nilai NULL
.
Contoh
Contoh 1
Contoh berikut menerapkan ekspresi numerik:
SELECT f, ML.IMPUTER(f, 'mean') OVER () AS output FROM UNNEST([NULL, -3, -3, -3, 1, 2, 3, 4, 5]) AS f ORDER BY f;
Outputnya terlihat mirip dengan yang berikut ini:
+------+--------+ | f | output | +------+--------+ | NULL | 0.75 | | -3 | -3.0 | | -3 | -3.0 | | -3 | -3.0 | | 1 | 1.0 | | 2 | 2.0 | | 3 | 3.0 | | 4 | 4.0 | | 5 | 5.0 | +------+--------+
Contoh 2
Contoh berikut menerapkan ekspresi string:
SELECT f, ML.IMPUTER(f, 'most_frequent') OVER () AS output FROM UNNEST([NULL, NULL, NULL, NULL, 'a', 'a', 'b', 'b', 'c', 'c', 'c']) AS f ORDER BY f;
Outputnya terlihat mirip dengan yang berikut ini:
+------+--------+ | f | output | +------+--------+ | NULL | c | | NULL | c | | NULL | c | | NULL | c | | a | a | | a | a | | b | b | | b | b | | c | c | | c | c | | c | c | +------+--------+
Langkah selanjutnya
- Untuk mengetahui informasi tentang prapemrosesan fitur, lihat Ringkasan prapemrosesan fitur.
- Untuk mengetahui informasi tentang pernyataan dan fungsi SQL yang didukung untuk setiap jenis model, lihat Perjalanan pengguna menyeluruh untuk setiap model.