La funzione ML.IMPUTER
Questo documento descrive la funzione ML.IMPUTER
, che consente di sostituire i valori NULL
in una stringa o un'espressione numerica. Puoi sostituire i valori NULL
con i valori utilizzati più di frequente per le espressioni stringa oppure con il valore media o mediana per le espressioni numeriche.
Se utilizzati nella clausola TRANSFORM
, i valori calcolati durante l'addestramento per il valore medio, mediano e più frequentemente utilizzato vengono utilizzati automaticamente nella previsione.
Sintassi
ML.IMPUTER(expression, strategy) OVER()
Argomenti
ML.IMPUTER
accetta i seguenti argomenti:
expression
: l'espressione numerica oSTRING
da attribuire.strategy
: un valoreSTRING
che specifica come sostituire i valoriNULL
. I valori validi sono:mean
: la media diexpression
. Puoi usare questo valore solo con espressioni numeriche.median
: la mediana diexpression
. Puoi usare questo valore solo con espressioni numeriche.most_frequent
: il valore più frequente nel mese diexpression
.
Output
ML.IMPUTER
restituisce un valore FLOAT64
(per le espressioni numeriche) o STRING
(per le espressioni stringa) che contiene la sostituzione del valore NULL
.
Esempi
Esempio 1
Nell'esempio seguente vengono imputate espressioni numeriche:
SELECT f, ML.IMPUTER(f, 'mean') OVER () AS output FROM UNNEST([NULL, -3, -3, -3, 1, 2, 3, 4, 5]) AS f ORDER BY f;
L'output è simile al seguente:
+------+--------+ | f | output | +------+--------+ | NULL | 0.75 | | -3 | -3.0 | | -3 | -3.0 | | -3 | -3.0 | | 1 | 1.0 | | 2 | 2.0 | | 3 | 3.0 | | 4 | 4.0 | | 5 | 5.0 | +------+--------+
Esempio 2
Nell'esempio seguente vengono imputate espressioni stringa:
SELECT f, ML.IMPUTER(f, 'most_frequent') OVER () AS output FROM UNNEST([NULL, NULL, NULL, NULL, 'a', 'a', 'b', 'b', 'c', 'c', 'c']) AS f ORDER BY f;
L'output è simile al seguente:
+------+--------+ | f | output | +------+--------+ | NULL | c | | NULL | c | | NULL | c | | NULL | c | | a | a | | a | a | | b | b | | b | b | | c | c | | c | c | | c | c | +------+--------+
Passaggi successivi
- Per informazioni sulla pre-elaborazione delle funzionalità, consulta Panoramica della pre-elaborazione delle funzionalità.
- Per informazioni sulle istruzioni e sulle funzioni SQL supportate per ogni tipo di modello, consulta Percorso dell'utente end-to-end per ogni modello.