Fungsi ML.IMPUTER

Dokumen ini menjelaskan fungsi ML.IMPUTER, yang memungkinkan Anda mengganti nilai NULL dalam string atau ekspresi numerik. Anda dapat mengganti nilai NULL dengan nilai yang paling sering digunakan untuk ekspresi string, atau nilai rata-rata atau median untuk ekspresi numerik.

Saat digunakan dalam klausa TRANSFORM, nilai yang dihitung selama pelatihan untuk nilai rata-rata, median, dan nilai yang paling sering digunakan secara otomatis digunakan dalam prediksi.

Sintaks

ML.IMPUTER(expression, strategy) OVER()

Argumen

ML.IMPUTER menggunakan argumen berikut:

  • expression: ekspresi numerik atau STRING yang akan diterapkan.
  • strategy: nilai STRING yang menentukan cara mengganti nilai NULL. Nilai yang valid adalah sebagai berikut:
    • mean: rata-rata dari expression. Anda hanya dapat menggunakan nilai ini dengan ekspresi numerik.
    • median: median expression. Anda hanya dapat menggunakan nilai ini dengan ekspresi numerik.
    • most_frequent: nilai paling sering di expression.

Output

ML.IMPUTER menampilkan nilai FLOAT64 (untuk ekspresi numerik) atau STRING (untuk ekspresi string) yang berisi pengganti untuk nilai NULL.

Contoh

Contoh 1

Contoh berikut menerapkan ekspresi numerik:

SELECT f, ML.IMPUTER(f, 'mean') OVER () AS output
FROM
  UNNEST([NULL, -3, -3, -3, 1, 2, 3, 4, 5]) AS f
ORDER BY f;

Outputnya terlihat mirip dengan yang berikut ini:

+------+--------+
|  f   | output |
+------+--------+
| NULL |   0.75 |
|   -3 |   -3.0 |
|   -3 |   -3.0 |
|   -3 |   -3.0 |
|    1 |    1.0 |
|    2 |    2.0 |
|    3 |    3.0 |
|    4 |    4.0 |
|    5 |    5.0 |
+------+--------+

Contoh 2

Contoh berikut menerapkan ekspresi string:

SELECT f, ML.IMPUTER(f, 'most_frequent') OVER () AS output
FROM
  UNNEST([NULL, NULL, NULL, NULL, 'a', 'a', 'b', 'b', 'c', 'c', 'c']) AS f
ORDER BY f;

Outputnya terlihat mirip dengan yang berikut ini:

+------+--------+
|  f   | output |
+------+--------+
| NULL | c      |
| NULL | c      |
| NULL | c      |
| NULL | c      |
| a    | a      |
| a    | a      |
| b    | b      |
| b    | b      |
| c    | c      |
| c    | c      |
| c    | c      |
+------+--------+

Langkah selanjutnya