Fonction ML.NGRAMS

Ce document décrit la fonction ML.NGRAMS, qui vous permet de créer des n-grammes des valeurs d'entrée.

Syntaxe

ML.NGRAMS(array_input, range [, separator])

Arguments

ML.NGRAMS utilise les arguments suivants :

  • array_input : une valeur ARRAY<STRING> qui représente les jetons à fusionner.
  • range : un tableau (ARRAY) de deux éléments INT64 ou une seule valeur INT64. Si vous spécifiez une valeur ARRAY, les éléments INT64 indiquent la plage de tailles de n-gramme à renvoyer. Indiquez les valeurs numériques dans l'ordre, de la plus faible à la plus élevée. Si vous spécifiez une seule valeur INT64 pour x, la plage des tailles de n-gramme à renvoyer est [x, x].
  • separator : une valeur STRING qui spécifie le séparateur permettant de relier deux jetons adjacents dans la sortie. La valeur par défaut est un espace blanc .

Sortie

ML.NGRAMS renvoie une valeur ARRAY<STRING> qui contient les n-grammes.

Exemple

L'exemple suivant génère toutes les combinaisons possibles de 2 jetons et de 3 jetons pour un ensemble de chaînes à trois entrée :

SELECT
  ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;

La sortie ressemble à ceci :

+-----------------------+
|        output         |
+-----------------------+
| ["a#b","a#b#c","b#c"] |
+-----------------------+

Étapes suivantes