ML.NGRAMS 関数

このドキュメントでは、入力値の N グラムを作成できる ML.NGRAMS 関数について説明します。

構文

ML.NGRAMS(array_input, range [, separator])

引数

ML.NGRAMS は次の引数を取ります。

  • array_input: マージするトークンを表す ARRAY<STRING> 値。
  • range: 2 つの INT64 要素または単一の INT64 値からなる ARRAYARRAY 値を指定した場合、INT64 要素が、返される N グラムのサイズの範囲を指定します。数値は昇順で指定します。単一の INT64× を指定した場合、返される N グラムのサイズの範囲は [x, x] になります。
  • separator: 出力における 2 つの隣接するトークンの区切り文字を指定する STRING 値。デフォルト値は空白 です。

出力

ML.NGRAMS は、N グラムを含む ARRAY<STRING> 値を返します。

次の例では、3 つの入力文字列のセットに対して、とりうる 2 トークンと 3 トークンのすべての組み合わせを出力します。

SELECT
  ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;

出力は次のようになります。

+-----------------------+
|        output         |
+-----------------------+
| ["a#b","a#b#c","b#c"] |
+-----------------------+

次のステップ