Fonction ML.IMPUTER
Ce document décrit la fonction ML.IMPUTER
, qui vous permet de remplacer les valeurs NULL
dans une expression de chaîne ou numérique. Vous pouvez remplacer les valeurs NULL
par la valeur la plus fréquemment utilisée pour les expressions de chaîne, ou par la valeur moyenne ou médiane pour les expressions numériques.
Lorsqu'elle est utilisée dans la clause TRANSFORM
, les valeurs calculées pendant l'entraînement pour la moyenne, la médiane et les valeurs les plus fréquemment utilisées sont automatiquement utilisées dans la prédiction.
Syntaxe
ML.IMPUTER(expression, strategy) OVER()
Arguments
ML.IMPUTER
utilise les arguments suivants :
expression
: expression numérique ou expressionSTRING
à imputer.strategy
: valeurSTRING
qui spécifie comment remplacer les valeursNULL
. Les valeurs admises sont les suivantes :mean
: la moyenne deexpression
. Vous ne pouvez l'utiliser qu'avec des expressions numériques.median
: la médiane deexpression
. Vous ne pouvez l'utiliser qu'avec des expressions numériques.most_frequent
: la valeur la plus fréquente dansexpression
.
Sortie
ML.IMPUTER
renvoie une valeur FLOAT64
(pour les expressions numériques) ou STRING
(pour les expressions de chaîne) qui remplace la valeur NULL
.
Examples
Exemple 1
L'exemple suivant impute des expressions numériques :
SELECT f, ML.IMPUTER(f, 'mean') OVER () AS output FROM UNNEST([NULL, -3, -3, -3, 1, 2, 3, 4, 5]) AS f ORDER BY f;
La sortie ressemble à ceci :
+------+--------+ | f | output | +------+--------+ | NULL | 0.75 | | -3 | -3.0 | | -3 | -3.0 | | -3 | -3.0 | | 1 | 1.0 | | 2 | 2.0 | | 3 | 3.0 | | 4 | 4.0 | | 5 | 5.0 | +------+--------+
Exemple 2
L'exemple suivant impute des expressions de chaîne :
SELECT f, ML.IMPUTER(f, 'most_frequent') OVER () AS output FROM UNNEST([NULL, NULL, NULL, NULL, 'a', 'a', 'b', 'b', 'c', 'c', 'c']) AS f ORDER BY f;
La sortie ressemble à ceci :
+------+--------+ | f | output | +------+--------+ | NULL | c | | NULL | c | | NULL | c | | NULL | c | | a | a | | a | a | | b | b | | b | b | | c | c | | c | c | | c | c | +------+--------+
Étapes suivantes
- Pour en savoir plus sur le prétraitement des caractéristiques, consultez la page Présentation du prétraitement des caractéristiques.
- Pour en savoir plus sur les instructions et les fonctions SQL compatibles avec chaque type de modèle, consultez la section Parcours utilisateur de bout en bout pour chaque modèle.