ML.NGRAMS 함수

이 문서에서는 입력 값의 n-gram을 만들 수 있는 ML.NGRAMS 함수를 설명합니다.

구문

ML.NGRAMS(array_input, range [, separator])

인수

ML.NGRAMS은 다음 인수를 사용합니다.

  • array_input: 병합할 토큰을 나타내는 ARRAY<STRING> 값입니다.
  • range: 두 개의 INT64 요소로 구성된 ARRAY 또는 단일 INT64 값입니다. ARRAY 값을 지정하면 INT64 요소는 반환할 N-그램 크기 범위를 제공합니다. 오름차순으로 숫자 값을 제공합니다. x의 단일 INT64 값을 지정할 경우 반환할 N-그램 크기 범위는 [x, x]입니다.
  • separator: 출력에서 인접한 토큰 두 개를 연결하도록 구분 기호를 지정하는 STRING 값입니다. 기본값은 공백 입니다.

출력

ML.NGRAMS는 N-그램이 포함된 ARRAY<STRING> 값을 반환합니다.

다음 예시에서는 3개의 입력 문자열 집합에 가능한 모든 2토큰 및 3토큰 조합을 출력합니다.

SELECT
  ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;

결과는 다음과 유사합니다.

+-----------------------+
|        output         |
+-----------------------+
| ["a#b","a#b#c","b#c"] |
+-----------------------+

다음 단계