Fonction ML.IMPUTER

Ce document décrit la fonction ML.IMPUTER, qui vous permet de remplacer les valeurs NULL dans une expression de chaîne ou numérique. Vous pouvez remplacer les valeurs NULL par la valeur la plus fréquemment utilisée pour les expressions de chaîne, ou par la valeur moyenne ou médiane pour les expressions numériques.

Lorsqu'elle est utilisée dans la clause TRANSFORM, les valeurs calculées pendant l'entraînement pour la moyenne, la médiane et les valeurs les plus fréquemment utilisées sont automatiquement utilisées dans la prédiction.

Syntaxe

ML.IMPUTER(expression, strategy) OVER()

Arguments

ML.IMPUTER utilise les arguments suivants :

  • expression : expression numérique ou expression STRING à imputer.
  • strategy : valeur STRING qui spécifie comment remplacer les valeurs NULL. Les valeurs admises sont les suivantes :
    • mean : la moyenne de expression. Vous ne pouvez l'utiliser qu'avec des expressions numériques.
    • median : la médiane de expression. Vous ne pouvez l'utiliser qu'avec des expressions numériques.
    • most_frequent : la valeur la plus fréquente dans expression.

Sortie

ML.IMPUTER renvoie une valeur FLOAT64 (pour les expressions numériques) ou STRING (pour les expressions de chaîne) qui remplace la valeur NULL.

Examples

Exemple 1

L'exemple suivant impute des expressions numériques :

SELECT f, ML.IMPUTER(f, 'mean') OVER () AS output
FROM
  UNNEST([NULL, -3, -3, -3, 1, 2, 3, 4, 5]) AS f
ORDER BY f;

La sortie ressemble à ceci :

+------+--------+
|  f   | output |
+------+--------+
| NULL |   0.75 |
|   -3 |   -3.0 |
|   -3 |   -3.0 |
|   -3 |   -3.0 |
|    1 |    1.0 |
|    2 |    2.0 |
|    3 |    3.0 |
|    4 |    4.0 |
|    5 |    5.0 |
+------+--------+

Exemple 2

L'exemple suivant impute des expressions de chaîne :

SELECT f, ML.IMPUTER(f, 'most_frequent') OVER () AS output
FROM
  UNNEST([NULL, NULL, NULL, NULL, 'a', 'a', 'b', 'b', 'c', 'c', 'c']) AS f
ORDER BY f;

La sortie ressemble à ceci :

+------+--------+
|  f   | output |
+------+--------+
| NULL | c      |
| NULL | c      |
| NULL | c      |
| NULL | c      |
| a    | a      |
| a    | a      |
| b    | b      |
| b    | b      |
| c    | c      |
| c    | c      |
| c    | c      |
+------+--------+

Étapes suivantes