Die Funktion ML.IMPUTER
In diesem Dokument wird die Funktion ML.IMPUTER
beschrieben, mit der Sie NULL
-Werte in einem String oder numerischen Ausdruck ersetzen können. Sie können NULL
-Werte durch den am häufigsten verwendeten Wert für Stringausdrücke ersetzen oder den Mittelwert oder den Medianwert für numerische Ausdrücke.
Bei Verwendung in der TRANSFORM
-Klausel werden die während des Trainings berechneten Werte für Mittelwert, Medianwert und am häufigsten verwendete Wert automatisch in der Vorhersage verwendet.
Syntax
ML.IMPUTER(expression, strategy) OVER()
Argumente
ML.IMPUTER
verwendet die folgenden Argumente:
expression
: der numerische oderSTRING
-Ausdruck, der festgelegt werden soll.strategy
: einSTRING
-Wert, der angibt, wieNULL
-Werte ersetzt werden sollen. Gültige Werte:mean
: der Mittelwert vonexpression
. Sie können diesen Wert nur mit numerischen Ausdrücken verwenden.median
: der Medianwert vonexpression
. Sie können diesen Wert nur mit numerischen Ausdrücken verwenden.most_frequent
: der häufigste Wert inexpression
.
Ausgabe
ML.IMPUTER
gibt einen FLOAT64
(für numerische Ausdrücke) oder STRING
(für Stringausdrücke) zurück, der den Ersatz für den Wert NULL
enthält.
Beispiele
Beispiel 1
Im folgenden Beispiel werden numerische Ausdrücke festgelegt:
SELECT f, ML.IMPUTER(f, 'mean') OVER () AS output FROM UNNEST([NULL, -3, -3, -3, 1, 2, 3, 4, 5]) AS f ORDER BY f;
Die Ausgabe sieht dann ungefähr so aus:
+------+--------+ | f | output | +------+--------+ | NULL | 0.75 | | -3 | -3.0 | | -3 | -3.0 | | -3 | -3.0 | | 1 | 1.0 | | 2 | 2.0 | | 3 | 3.0 | | 4 | 4.0 | | 5 | 5.0 | +------+--------+
Beispiel 2
Im folgenden Beispiel werden Stringausdrücke festgelegt:
SELECT f, ML.IMPUTER(f, 'most_frequent') OVER () AS output FROM UNNEST([NULL, NULL, NULL, NULL, 'a', 'a', 'b', 'b', 'c', 'c', 'c']) AS f ORDER BY f;
Die Ausgabe sieht dann ungefähr so aus:
+------+--------+ | f | output | +------+--------+ | NULL | c | | NULL | c | | NULL | c | | NULL | c | | a | a | | a | a | | b | b | | b | b | | c | c | | c | c | | c | c | +------+--------+
Nächste Schritte
- Weitere Informationen zur Feature-Vorverarbeitung finden Sie unter Feature-Vorverarbeitung.
- Informationen zu den unterstützten SQL-Anweisungen und -Funktionen für die einzelnen Modelltypen erhalten Sie unter End-to-End-Nutzerpfad für jedes Modell.