Funktion ML.NGRAMS
In diesem Dokument wird die Funktion ML.NGRAMS
beschrieben, mit der Sie N-Gramme der Eingabewerte erstellen können.
Syntax
ML.NGRAMS(array_input, range [, separator])
Argumente
ML.NGRAMS
verwendet die folgenden Argumente:
array_input
: einARRAY<STRING>
-Wert, der die zusammenzuführenden Tokens darstellt.range
: einARRAY
von zweiINT64
-Elementen oder ein einzelnerINT64
-Wert. Wenn Sie einenARRAY
-Wert angeben, wird mit denINT64
-Elementen der Bereich der N-Gramm-Größen festgelegt, die zurückgegeben werden sollen. Geben Sie dabei die numerischen Werte in absteigender Reihenfolge an. Wenn Sie einen einzelnenINT64
-Wert von x angeben, ist der Bereich der N-Gramm-Größen[x, x]
.separator
: einSTRING
-Wert, der das Trennzeichen für die Verbindung zweier benachbarter Tokens in der Ausgabe angibt. Der Standardwert ist das Leerzeichen.
Ausgabe
ML.NGRAMS
gibt einen ARRAY<STRING>
-Wert zurück, der die N-Gramme enthält.
Beispiel
Im folgenden Beispiel werden alle denkbaren Kombinationen aus 2 und 3 Tokens für eine Gruppe von drei Eingabestrings ausgegeben:
SELECT ML.NGRAMS(['a', 'b', 'c'], [2,3], '#') AS output;
Die Ausgabe sieht dann ungefähr so aus:
+-----------------------+ | output | +-----------------------+ | ["a#b","a#b#c","b#c"] | +-----------------------+
Nächste Schritte
- Weitere Informationen zur Feature-Vorverarbeitung finden Sie unter Feature-Vorverarbeitung.
- Informationen zu den unterstützten SQL-Anweisungen und -Funktionen für die einzelnen Modelltypen erhalten Sie unter End-to-End-Nutzerpfad für jedes Modell.