Função ML.NGRAMS
Neste documento, descrevemos a função ML.NGRAMS
, que permite criar
n-grams dos valores de entrada.
Sintaxe
ML.NGRAMS(array_input, range [, separator])
Argumentos
ML.NGRAMS
usa os seguintes argumentos:
array_input
: um valorARRAY<STRING>
que representa os tokens a serem mesclados.range
: umARRAY
de dois elementosINT64
ou um único valorINT64
. Se você especificar um valorARRAY
, os elementosINT64
fornecerão o intervalo de tamanhos n-grama a serem retornados. Forneça os valores numéricos em ordem, da menor para a maior. Se você especificar um único valorINT64
de x, o intervalo de tamanhos n-gram a serem retornados será[x, x]
.separator
um valorSTRING
que especifica o separador para conectar dois tokens adjacentes na saída. O valor padrão é espaço em branco.
Saída
ML.NGRAMS
retorna um valor ARRAY<STRING>
que contém os n-grams.
Exemplo
O exemplo a seguir gera todas as combinações possíveis de dois e três tokens para um conjunto de três strings de entrada:
SELECT ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;
A saída será assim:
+-----------------------+ | output | +-----------------------+ | ["a#b","a#b#c","b#c"] | +-----------------------+
A seguir
- Para informações sobre o pré-processamento de atributos, consulte Visão geral do pré-processamento de atributos.
- Para informações sobre as funções e instruções SQL compatíveis com cada tipo de modelo, consulte Jornada do usuário completa de cada modelo.