ML.NGRAMS 関数
このドキュメントでは、入力値の N グラムを作成できる ML.NGRAMS
関数について説明します。
構文
ML.NGRAMS(array_input, range [, separator])
引数
ML.NGRAMS
は次の引数を取ります。
array_input
: マージするトークンを表すARRAY<STRING>
値。range
: 2 つのINT64
要素または単一のINT64
値からなるARRAY
。ARRAY
値を指定した場合、INT64
要素が、返される N グラムのサイズの範囲を指定します。数値は昇順で指定します。単一のINT64
値 × を指定した場合、返される N グラムのサイズの範囲は[x, x]
になります。separator
: 出力における 2 つの隣接するトークンの区切り文字を指定するSTRING
値。デフォルト値は空白です。
出力
ML.NGRAMS
は、N グラムを含む ARRAY<STRING>
値を返します。
例
次の例では、3 つの入力文字列のセットに対して、とりうる 2 トークンと 3 トークンのすべての組み合わせを出力します。
SELECT ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;
出力は次のようになります。
+-----------------------+ | output | +-----------------------+ | ["a#b","a#b#c","b#c"] | +-----------------------+
次のステップ
- 特徴の前処理の詳細については、特徴前処理の概要をご覧ください。
- 各モデルタイプでサポートされている SQL ステートメントと関数については、各モデルのエンドツーエンドのユーザー ジャーニーをご覧ください。