Función ML.NGRAMS

En este documento se describe la función ML.NGRAMS, que te permite crear n-gramas de los valores de entrada.

Sintaxis

ML.NGRAMS(array_input, range [, separator])

Argumentos

ML.NGRAMS toma los siguientes argumentos:

  • array_input: un valor ARRAY<STRING> que representa los tokens que se combinarán.
  • range: es un ARRAY de dos elementos INT64 o un solo valor INT64. Si especificas un valor ARRAY, los elementos INT64 proporcionan el rango de tamaños de n-gramas que se muestra. Proporciona los valores numéricos en orden, de menor a mayor. Si especificas un solo valor INT64 de x, el rango de tamaños de n-gramas que se muestra es [x, x].
  • separator: Un valor STRING que especifica el separador para conectar dos tokens adyacentes en el resultado. El valor predeterminado es el espacio en blanco .

Salida

ML.NGRAMS muestra un valor ARRAY<STRING> que contiene los n-gramas.

Ejemplo

En el ejemplo siguiente, se muestran todas las combinaciones posibles de 2 tokens y 3 tokens para un conjunto de tres cadenas de entrada:

SELECT
  ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;

El resultado es similar al siguiente:

+-----------------------+
|        output         |
+-----------------------+
| ["a#b","a#b#c","b#c"] |
+-----------------------+

¿Qué sigue?