Fonction ML.BUCKETIZE

Ce document décrit la fonction ML.BUCKETIZE, qui vous permet de diviser une expression numérique en buckets.

Syntaxe

ML.BUCKETIZE(numerical_expression, array_split_points [, exclude_boundaries])

Arguments

ML.BUCKETIZE utilise les arguments suivants :

  • numerical_expression : expression numérique à diviser en buckets.
  • array_split_points : tableau de valeurs numériques fournissant les points auxquels diviser la valeur numerical_expression. Indiquez les valeurs numériques dans l'ordre, de la plus faible à la plus élevée. La plage de buckets possibles est déterminée par les limites supérieure et inférieure du tableau. Par exemple, si la valeur de array_split_points est [1, 2, 3, 4], la valeur de numerical_expression peut potentiellement être divisée en cinq buckets.
  • exclude_boundaries : valeur BOOL qui détermine si les valeurs limites supérieure et inférieure de array_split_points sont utilisées. Si la valeur est TRUE, les valeurs limites ne sont pas utilisées pour créer des buckets. Par exemple, si la valeur de array_split_points est [1, 2, 3, 4] et que exclude_boundaries est TRUE, la valeur de numerical_expression peut potentiellement être divisée en trois buckets. La valeur par défaut est FALSE.

Sortie

ML.BUCKETIZE renvoie une valeur STRING qui contient le nom du bucket. Les noms de buckets renvoyés sont au format bin_<bucket_index>, avec bucket_index commençant à 1.

Exemple

L'exemple suivant divise une expression numérique en buckets avec et sans valeurs limites :

SELECT
  ML.BUCKETIZE(2.5, [1, 2, 3]) AS bucket,
  ML.BUCKETIZE(2.5, [1, 2, 3], TRUE) AS bucket_without_boundaries;

La sortie ressemble à ceci :

+---------+----------------------------+
| bucket  | bucket_without_boundaries  |
+---------+----------------------------+
| bin_3   | bin_2                      |
+---------+----------------------------+

Étapes suivantes