Speech-to-Text fornisce il modello latest_short
per il riconoscimento vocale costituito da singole frasi. Questa funzionalità può essere utile per le applicazioni in cui gli utenti danno comandi vocali singoli anziché monologhi o dettature nel formato lungo.
Quando per una richiesta di riconoscimento viene utilizzato un riconoscitore con il modello latest_short
, Speech-to-Text interrompe l'esecuzione del riconoscimento quando rileva che un'espressione è terminata. Speech-to-Text restituirà una risposta all'evento attività vocale con il tipo END_OF_SINGLE_UTTERANCE
seguito dai risultati della trascrizione.
Singola espressione e StreamingRecognize
Se per una richiesta StreamingRecognize
viene selezionato un modello latest_short
Recognizer
, Speech-to-Text chiuderà automaticamente lo stream al termine dell'enunciazione.
Con eventi di attività vocale
Se sono stati attivati anche gli eventi di attività vocale per una richiesta StreamingRecognize, la funzionalità Converti Speech-to-Text restituirà comunque gli eventi di attività vocale inizio/fine della voce. I timeout dell'attività vocale per l'inizio del parlato continueranno a essere applicati. I timeout per l'attività vocale relativi alla fine del parlato non verranno applicati, poiché lo stream verrà chiuso non appena l'enunciazione termina.