Rappresenta la codifica del testo utilizzata dal chiamante per elaborare l'output. Ti consigliamo di fornire un EncodingType
perché l'API fornisce gli offset iniziali per vari output, come token e menzioni, e le lingue che utilizzano in modo nativo codifiche di testo diverse potrebbero accedere agli offset in modo diverso.
Enum | |
---|---|
NONE |
Se EncodingType non è specificato, le informazioni dipendenti dalla codifica (ad esempio beginOffset ) verranno impostate su -1 . |
UTF8 |
Le informazioni dipendenti dalla codifica (ad esempio beginOffset ) vengono calcolate in base alla codifica UTF-8 dell'input. C++ e Go sono esempi di linguaggi che utilizzano questa codifica in modo nativo. |
UTF16 |
Le informazioni dipendenti dalla codifica (ad esempio beginOffset ) vengono calcolate in base alla codifica UTF-16 dell'input. Java e JavaScript sono esempi di linguaggi che utilizzano questa codifica in modo nativo. |
UTF32 |
Le informazioni dipendenti dalla codifica (ad esempio beginOffset ) vengono calcolate in base alla codifica UTF-32 dell'input. Python è un esempio di linguaggio che utilizza questa codifica in modo nativo. |