Die Funktion ML.IMPUTER

In diesem Dokument wird die Funktion ML.IMPUTER beschrieben, mit der Sie NULL-Werte in einem String oder numerischen Ausdruck ersetzen können. Sie können NULL-Werte durch den am häufigsten verwendeten Wert für Stringausdrücke ersetzen oder den Mittelwert oder den Medianwert für numerische Ausdrücke.

Bei Verwendung in der TRANSFORM-Klausel werden die während des Trainings berechneten Werte für Mittelwert, Medianwert und am häufigsten verwendete Wert automatisch in der Vorhersage verwendet.

Syntax

ML.IMPUTER(expression, strategy) OVER()

Argumente

ML.IMPUTER verwendet die folgenden Argumente:

  • expression: der numerische oder STRING-Ausdruck, der festgelegt werden soll.
  • strategy: ein STRING-Wert, der angibt, wie NULL-Werte ersetzt werden sollen. Gültige Werte:
    • mean: der Mittelwert von expression. Sie können diesen Wert nur mit numerischen Ausdrücken verwenden.
    • median: der Medianwert von expression. Sie können diesen Wert nur mit numerischen Ausdrücken verwenden.
    • most_frequent: der häufigste Wert in expression.

Ausgabe

ML.IMPUTER gibt einen FLOAT64 (für numerische Ausdrücke) oder STRING (für Stringausdrücke) zurück, der den Ersatz für den Wert NULL enthält.

Beispiele

Beispiel 1

Im folgenden Beispiel werden numerische Ausdrücke festgelegt:

SELECT f, ML.IMPUTER(f, 'mean') OVER () AS output
FROM
  UNNEST([NULL, -3, -3, -3, 1, 2, 3, 4, 5]) AS f
ORDER BY f;

Die Ausgabe sieht dann ungefähr so aus:

+------+--------+
|  f   | output |
+------+--------+
| NULL |   0.75 |
|   -3 |   -3.0 |
|   -3 |   -3.0 |
|   -3 |   -3.0 |
|    1 |    1.0 |
|    2 |    2.0 |
|    3 |    3.0 |
|    4 |    4.0 |
|    5 |    5.0 |
+------+--------+

Beispiel 2

Im folgenden Beispiel werden Stringausdrücke festgelegt:

SELECT f, ML.IMPUTER(f, 'most_frequent') OVER () AS output
FROM
  UNNEST([NULL, NULL, NULL, NULL, 'a', 'a', 'b', 'b', 'c', 'c', 'c']) AS f
ORDER BY f;

Die Ausgabe sieht dann ungefähr so aus:

+------+--------+
|  f   | output |
+------+--------+
| NULL | c      |
| NULL | c      |
| NULL | c      |
| NULL | c      |
| a    | a      |
| a    | a      |
| b    | b      |
| b    | b      |
| c    | c      |
| c    | c      |
| c    | c      |
+------+--------+

Nächste Schritte