Fonction ML.QUANTILE_BUCKETIZE

Ce document décrit la fonction ML.QUANTILE_BUCKETIZE, qui vous permet de diviser une caractéristique numérique continue en buckets basés sur des quantiles.

Lorsqu'elle est utilisée dans la clause TRANSFORM, les mêmes quantiles sont automatiquement utilisés dans la prédiction.

Syntaxe

ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()

Arguments

ML.QUANTILE_BUCKETIZE utilise les arguments suivants :

  • numerical_expression : l'expression numérique à diviser en buckets.
  • num_buckets : une valeur INT64 qui spécifie le nombre de buckets utilisés pour diviser numerical_expression.

Sortie

ML.QUANTILE_BUCKETIZE renvoie une valeur STRING qui contient le nom du bucket. Les noms de bucket renvoyés sont au format bin_<bucket_index>, avec bucket_index commençant à 1.

Exemple

L'exemple suivant divise une expression numérique de cinq éléments en trois buckets :

SELECT
  f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket
FROM
  UNNEST([1,2,3,4,5]) AS f;

La sortie ressemble à ceci :

+---+--------+
| f | bucket |
+---+--------+
| 3 | bin_2  |
| 5 | bin_3  |
| 2 | bin_2  |
| 1 | bin_1  |
| 4 | bin_3  |
+---+--------+

Étapes suivantes