Fonction ML.QUANTILE_BUCKETIZE
Ce document décrit la fonction ML.QUANTILE_BUCKETIZE
, qui vous permet de diviser une caractéristique numérique continue en buckets basés sur des quantiles.
Lorsqu'elle est utilisée dans la clause TRANSFORM
, les mêmes quantiles sont automatiquement utilisés dans la prédiction.
Syntaxe
ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()
Arguments
ML.QUANTILE_BUCKETIZE
utilise les arguments suivants :
numerical_expression
: l'expression numérique à diviser en buckets.num_buckets
: une valeurINT64
qui spécifie le nombre de buckets utilisés pour divisernumerical_expression
.
Sortie
ML.QUANTILE_BUCKETIZE
renvoie une valeur STRING
qui contient le nom du bucket. Les noms de bucket renvoyés sont au format bin_<bucket_index>
, avec bucket_index
commençant à 1
.
Exemple
L'exemple suivant divise une expression numérique de cinq éléments en trois buckets :
SELECT f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket FROM UNNEST([1,2,3,4,5]) AS f;
La sortie ressemble à ceci :
+---+--------+ | f | bucket | +---+--------+ | 3 | bin_2 | | 5 | bin_3 | | 2 | bin_2 | | 1 | bin_1 | | 4 | bin_3 | +---+--------+
Étapes suivantes
- Pour en savoir plus sur le prétraitement des caractéristiques, consultez la page Présentation du prétraitement des caractéristiques.
- Pour en savoir plus sur les instructions et les fonctions SQL compatibles avec chaque type de modèle, consultez la section Parcours utilisateur de bout en bout pour chaque modèle.