Die Funktion ML.BUCKETIZE

In diesem Dokument wird die Funktion ML.BUCKETIZE beschrieben, mit der Sie einen numerischen Ausdruck in Buckets aufteilen können.

Syntax

ML.BUCKETIZE(numerical_expression, array_split_points [, exclude_boundaries])

Argumente

ML.BUCKETIZE verwendet die folgenden Argumente:

  • numerical_expression: Der numerische Ausdruck, der gruppiert werden soll.
  • array_split_points: Ein Array von numerischen Werten, die die Punkte angeben, an denen der Wert numerical_expression aufgeteilt werden soll. Geben Sie die numerischen Werte in der angegebenen Reihenfolge an, vom niedrigsten zum höchsten Wert. Der Bereich der möglichen Buckets wird durch die obere und die untere Grenze des Arrays bestimmt. Wenn der Wert von array_split_points beispielsweise [1, 2, 3, 4] ist, gibt es fünf mögliche Buckets, in die der Wert numerical_expression unterteilt werden kann.
  • exclude_boundaries: Ein BOOL-Wert, der bestimmt, ob die oberen und unteren Grenzwerte von array_split_points verwendet werden. Bei TRUE werden die Grenzwerte nicht für das Erstellen von Buckets verwendet. Beispiel: Wenn der Wert array_split_points-Wert [1, 2, 3, 4] ist und exclude_boundaries TRUE ist, gibt es drei mögliche Buckets, in die der Wert numerical_expression in Buckets aufgeteilt werden. Der Standardwert ist FALSE.

Ausgabe

ML.BUCKETIZE gibt einen STRING-Wert aus, der den Namen des Buckets enthält. Die zurückgegebenen Bucket-Namen haben das Format bin_<bucket_index>, wobei bucket_index bei 1 beginnt.

Beispiel

Im folgenden Beispiel wird ein numerischer Ausdruck sowohl mit als auch ohne Grenzen gruppiert.

SELECT
  ML.BUCKETIZE(2.5, [1, 2, 3]) AS bucket,
  ML.BUCKETIZE(2.5, [1, 2, 3], TRUE) AS bucket_without_boundaries;

Die Ausgabe sieht dann ungefähr so aus:

+---------+----------------------------+
| bucket  | bucket_without_boundaries  |
+---------+----------------------------+
| bin_3   | bin_2                      |
+---------+----------------------------+

Nächste Schritte