Die Funktion ML.HASH_BUCKETIZE
In diesem Dokument wird die Funktion ML.HASH_BUCKETIZE
beschrieben, mit der Sie einen Stringausdruck in einen deterministischen Hash konvertieren und diesen dann anhand des Modulo-Werts dieses Hashs in Buckets aufteilen können.
Syntax
ML.HASH_BUCKETIZE(string_expression, hash_bucket_size)
Argumente
ML.HASH_BUCKETIZE
verwendet die folgenden Argumente:
string_expression
: der in Buckets aufzuteilendeSTRING
-Ausdruck.hash_bucket_size
: einINT64
-Wert, der die Anzahl der zu erstellenden Buckets angibt. Dieser Wert muss größer oder gleich0
sein. Wennhash_bucket_size
gleich0
ist, hasht die Funktion nur den String, ohne den Hashwert zu kategorisieren.
Ausgabe
ML.HASH_BUCKETIZE
gibt einen INT64
-Wert zurück, der den Bucket angibt.
Beispiel
Im folgenden Beispiel werden Stringausdrücke in drei Buckets unterteilt:
SELECT f, ML.HASH_BUCKETIZE(f, 3) AS bucket FROM UNNEST(['a', 'b', 'c', 'd']) AS f;
Die Ausgabe sieht dann ungefähr so aus:
+---+--------+ | f | bucket | +---+--------+ | a | 0 | +---+--------+ | b | 1 | +---+--------+ | c | 1 | +---+--------+ | d | 2 | +------------+
Nächste Schritte
- Weitere Informationen zur Feature-Vorverarbeitung finden Sie unter Feature-Vorverarbeitung.
- Informationen zu den unterstützten SQL-Anweisungen und -Funktionen für die einzelnen Modelltypen erhalten Sie unter End-to-End-Nutzerpfad für jedes Modell.