La funzione ML.IMPUTER

Questo documento descrive la funzione ML.IMPUTER, che consente di sostituire i valori NULL in una stringa o un'espressione numerica. Puoi sostituire i valori NULL con i valori utilizzati più di frequente per le espressioni stringa oppure con il valore media o mediana per le espressioni numeriche.

Se utilizzati nella clausola TRANSFORM, i valori calcolati durante l'addestramento per il valore medio, mediano e più frequentemente utilizzato vengono utilizzati automaticamente nella previsione.

Sintassi

ML.IMPUTER(expression, strategy) OVER()

Argomenti

ML.IMPUTER accetta i seguenti argomenti:

  • expression: l'espressione numerica o STRING da attribuire.
  • strategy: un valore STRING che specifica come sostituire i valori NULL. I valori validi sono:
    • mean: la media di expression. Puoi usare questo valore solo con espressioni numeriche.
    • median: la mediana di expression. Puoi usare questo valore solo con espressioni numeriche.
    • most_frequent: il valore più frequente nel mese di expression.

Output

ML.IMPUTER restituisce un valore FLOAT64 (per le espressioni numeriche) o STRING (per le espressioni stringa) che contiene la sostituzione del valore NULL.

Esempi

Esempio 1

Nell'esempio seguente vengono imputate espressioni numeriche:

SELECT f, ML.IMPUTER(f, 'mean') OVER () AS output
FROM
  UNNEST([NULL, -3, -3, -3, 1, 2, 3, 4, 5]) AS f
ORDER BY f;

L'output è simile al seguente:

+------+--------+
|  f   | output |
+------+--------+
| NULL |   0.75 |
|   -3 |   -3.0 |
|   -3 |   -3.0 |
|   -3 |   -3.0 |
|    1 |    1.0 |
|    2 |    2.0 |
|    3 |    3.0 |
|    4 |    4.0 |
|    5 |    5.0 |
+------+--------+

Esempio 2

Nell'esempio seguente vengono imputate espressioni stringa:

SELECT f, ML.IMPUTER(f, 'most_frequent') OVER () AS output
FROM
  UNNEST([NULL, NULL, NULL, NULL, 'a', 'a', 'b', 'b', 'c', 'c', 'c']) AS f
ORDER BY f;

L'output è simile al seguente:

+------+--------+
|  f   | output |
+------+--------+
| NULL | c      |
| NULL | c      |
| NULL | c      |
| NULL | c      |
| a    | a      |
| a    | a      |
| b    | b      |
| b    | b      |
| c    | c      |
| c    | c      |
| c    | c      |
+------+--------+

Passaggi successivi