Fungsi ML.BUCKETIZE
Dokumen ini menjelaskan fungsi ML.BUCKETIZE
, yang memungkinkan Anda membagi
ekspresi numerik ke dalam bucket.
Sintaks
ML.BUCKETIZE(numerical_expression, array_split_points [, exclude_boundaries])
Argumen
ML.BUCKETIZE
menggunakan argumen berikut:
numerical_expression
: ekspresi numerik yang akan dikelompokkan.array_split_points
: array nilai numerik yang memberikan titik untuk membagi nilainumerical_expression
. Berikan nilai numerik secara berurutan, terendah hingga tertinggi. Rentang kemungkinan bucket ditentukan oleh batas atas dan bawah array. Misalnya, jika nilaiarray_split_points
adalah[1, 2, 3, 4]
, berarti ada lima potensi bucket tempat nilainumerical_expression
dapat dikelompokkan.exclude_boundaries
: nilaiBOOL
yang menentukan apakah batas atas dan bawah dariarray_split_points
digunakan. JikaTRUE
, nilai batas tidak digunakan untuk membuat bucket. Misalnya, jika nilaiarray_split_points
adalah[1, 2, 3, 4]
danexclude_boundaries
adalahTRUE
, ada tiga potensi bucket tempat nilainumerical_expression
dapat dikelompokkan. Nilai defaultnya adalahFALSE
.
Output
ML.BUCKETIZE
menampilkan nilai STRING
yang berisi nama bucket.
Nama bucket yang ditampilkan memiliki format bin_<bucket_index>
, dengan
bucket_index
dimulai dari 1
.
Contoh
Contoh berikut mengelompokkan ekspresi numerik ke dalam bucket dengan dan tanpa batas:
SELECT ML.BUCKETIZE(2.5, [1, 2, 3]) AS bucket, ML.BUCKETIZE(2.5, [1, 2, 3], TRUE) AS bucket_without_boundaries;
Outputnya terlihat mirip dengan ini:
+---------+----------------------------+ | bucket | bucket_without_boundaries | +---------+----------------------------+ | bin_3 | bin_2 | +---------+----------------------------+
Langkah selanjutnya
- Untuk mengetahui informasi tentang prapemrosesan fitur, lihat Ringkasan prapemrosesan fitur.
- Untuk mengetahui informasi tentang pernyataan dan fungsi SQL yang didukung untuk setiap jenis model, lihat Perjalanan pengguna menyeluruh untuk setiap model.