Función ML.NGRAMS
En este documento se describe la función ML.NGRAMS
, que te permite crear n-gramas de los valores de entrada.
Sintaxis
ML.NGRAMS(array_input, range [, separator])
Argumentos
ML.NGRAMS
toma los siguientes argumentos:
array_input
: un valorARRAY<STRING>
que representa los tokens que se combinarán.range
: es unARRAY
de dos elementosINT64
o un solo valorINT64
. Si especificas un valorARRAY
, los elementosINT64
proporcionan el rango de tamaños de n-gramas que se muestra. Proporciona los valores numéricos en orden, de menor a mayor. Si especificas un solo valorINT64
de x, el rango de tamaños de n-gramas que se muestra es[x, x]
.separator
: Un valorSTRING
que especifica el separador para conectar dos tokens adyacentes en el resultado. El valor predeterminado es el espacio en blanco.
Salida
ML.NGRAMS
muestra un valor ARRAY<STRING>
que contiene los n-gramas.
Ejemplo
En el ejemplo siguiente, se muestran todas las combinaciones posibles de 2 tokens y 3 tokens para un conjunto de tres cadenas de entrada:
SELECT ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;
El resultado es similar al siguiente:
+-----------------------+ | output | +-----------------------+ | ["a#b","a#b#c","b#c"] | +-----------------------+
¿Qué sigue?
- Para obtener información sobre el procesamiento previo de atributos, consulta Descripción general del procesamiento previo de atributos.
- Para obtener información sobre las instrucciones y funciones de SQL compatibles con cada tipo de modelo, consulta Recorrido del usuario de extremo a extremo para cada modelo.