ML.HASH_BUCKETIZE 関数
このドキュメントでは、文字列式を決定論的ハッシュに変換し、そのハッシュの剰余値でバケット化できる ML.HASH_BUCKETIZE
関数について説明します。
構文
ML.HASH_BUCKETIZE(string_expression, hash_bucket_size)
引数
ML.HASH_BUCKETIZE
は次の引数を取ります。
string_expression
: バケット化するSTRING
式。hash_bucket_size
: 作成するバケットの数を指定するINT64
値。0
以上の値を指定してください。hash_bucket_size
が0
と等しい場合、関数はハッシュ値をバケット化せずに、文字列のみをハッシュ化します。
出力
ML.HASH_BUCKETIZE
は、バケットを識別する INT64
値を返します。
例
次の例では、文字列式を 3 つのバケットにバケット化します。
SELECT f, ML.HASH_BUCKETIZE(f, 3) AS bucket FROM UNNEST(['a', 'b', 'c', 'd']) AS f;
出力は次のようになります。
+---+--------+ | f | bucket | +---+--------+ | a | 0 | +---+--------+ | b | 1 | +---+--------+ | c | 1 | +---+--------+ | d | 2 | +------------+
次のステップ
- 特徴の前処理の詳細については、特徴前処理の概要をご覧ください。
- 各モデルタイプでサポートされている SQL ステートメントと関数については、各モデルのエンドツーエンドのユーザー ジャーニーをご覧ください。