Fungsi ML.HASH_BUCKETIZE
Dokumen ini menjelaskan fungsi ML.HASH_BUCKETIZE
, yang memungkinkan Anda
mengonversi ekspresi string menjadi hash deterministik, lalu mengelompokkannya berdasarkan
nilai modular hash tersebut.
Sintaks
ML.HASH_BUCKETIZE(string_expression, hash_bucket_size)
Argumen
ML.HASH_BUCKETIZE
menggunakan argumen berikut:
string_expression
: ekspresiSTRING
yang akan dikelompokkan.hash_bucket_size
: nilaiINT64
yang menentukan jumlah bucket yang akan dibuat. Nilai ini harus lebih besar dari atau sama dengan0
. Jikahash_bucket_size
sama dengan0
, fungsi tersebut hanya akan meng-hash string tanpa mengelompokkan nilai yang di-hash.
Output
ML.HASH_BUCKETIZE
menampilkan nilai INT64
yang mengidentifikasi bucket.
Contoh
Contoh berikut mengelompokkan ekspresi string menjadi tiga bucket:
SELECT f, ML.HASH_BUCKETIZE(f, 3) AS bucket FROM UNNEST(['a', 'b', 'c', 'd']) AS f;
Outputnya terlihat mirip dengan yang berikut ini:
+---+--------+ | f | bucket | +---+--------+ | a | 0 | +---+--------+ | b | 1 | +---+--------+ | c | 1 | +---+--------+ | d | 2 | +------------+
Langkah selanjutnya
- Untuk mengetahui informasi tentang prapemrosesan fitur, lihat Ringkasan prapemrosesan fitur.
- Untuk mengetahui informasi tentang pernyataan dan fungsi SQL yang didukung untuk setiap jenis model, lihat Perjalanan pengguna menyeluruh untuk setiap model.