Fonction ML.NGRAMS
Ce document décrit la fonction ML.NGRAMS
, qui vous permet de créer des n-grammes des valeurs d'entrée.
Syntaxe
ML.NGRAMS(array_input, range [, separator])
Arguments
ML.NGRAMS
utilise les arguments suivants :
array_input
: une valeurARRAY<STRING>
qui représente les jetons à fusionner.range
: un tableau (ARRAY
) de deux élémentsINT64
ou une seule valeurINT64
. Si vous spécifiez une valeurARRAY
, les élémentsINT64
indiquent la plage de tailles de n-gramme à renvoyer. Indiquez les valeurs numériques dans l'ordre, de la plus faible à la plus élevée. Si vous spécifiez une seule valeurINT64
pour x, la plage des tailles de n-gramme à renvoyer est[x, x]
.separator
: une valeurSTRING
qui spécifie le séparateur permettant de relier deux jetons adjacents dans la sortie. La valeur par défaut est un espace blanc.
Sortie
ML.NGRAMS
renvoie une valeur ARRAY<STRING>
qui contient les n-grammes.
Exemple
L'exemple suivant génère toutes les combinaisons possibles de 2 jetons et de 3 jetons pour un ensemble de chaînes à trois entrée :
SELECT ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;
La sortie ressemble à ceci :
+-----------------------+ | output | +-----------------------+ | ["a#b","a#b#c","b#c"] | +-----------------------+
Étapes suivantes
- Pour en savoir plus sur le prétraitement des caractéristiques, consultez la page Présentation du prétraitement des caractéristiques.
- Pour en savoir plus sur les instructions et les fonctions SQL compatibles avec chaque type de modèle, consultez la section Parcours utilisateur de bout en bout pour chaque modèle.