ML.NGRAMS 함수
이 문서에서는 입력 값의 n-gram을 만들 수 있는 ML.NGRAMS
함수를 설명합니다.
구문
ML.NGRAMS(array_input, range [, separator])
인수
ML.NGRAMS
은 다음 인수를 사용합니다.
array_input
: 병합할 토큰을 나타내는ARRAY<STRING>
값입니다.range
: 두 개의INT64
요소로 구성된ARRAY
또는 단일INT64
값입니다.ARRAY
값을 지정하면INT64
요소는 반환할 N-그램 크기 범위를 제공합니다. 오름차순으로 숫자 값을 제공합니다. x의 단일INT64
값을 지정할 경우 반환할 N-그램 크기 범위는[x, x]
입니다.separator
: 출력에서 인접한 토큰 두 개를 연결하도록 구분 기호를 지정하는STRING
값입니다. 기본값은 공백입니다.
출력
ML.NGRAMS
는 N-그램이 포함된 ARRAY<STRING>
값을 반환합니다.
예
다음 예시에서는 3개의 입력 문자열 집합에 가능한 모든 2토큰 및 3토큰 조합을 출력합니다.
SELECT ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;
결과는 다음과 유사합니다.
+-----------------------+ | output | +-----------------------+ | ["a#b","a#b#c","b#c"] | +-----------------------+
다음 단계
- 특성 전처리에 대한 자세한 내용은 특성 전처리 개요를 참조하세요.
- 각 모델 유형에 지원되는 SQL 문과 함수에 대한 자세한 내용은 각 모델의 엔드 투 엔드 사용자 경험을 참조하세요.