Comportamento di un singolo enunciato

Speech-to-Text fornisce il modello latest_short per il riconoscimento vocale costituito da singole frasi. Questa funzionalità può essere utile per le applicazioni in cui gli utenti danno comandi vocali singoli anziché monologhi o dettature nel formato lungo.

Quando per una richiesta di riconoscimento viene utilizzato un riconoscitore con il modello latest_short, Speech-to-Text interrompe l'esecuzione del riconoscimento quando rileva che un'espressione è terminata. Speech-to-Text restituirà una risposta all'evento attività vocale con il tipo END_OF_SINGLE_UTTERANCE seguito dai risultati della trascrizione.

Singola espressione e StreamingRecognize

Se per una richiesta StreamingRecognize viene selezionato un modello latest_short Recognizer, Speech-to-Text chiuderà automaticamente lo stream al termine dell'enunciazione.

Con eventi di attività vocale

Se sono stati attivati anche gli eventi di attività vocale per una richiesta StreamingRecognize, la funzionalità Converti Speech-to-Text restituirà comunque gli eventi di attività vocale inizio/fine della voce. I timeout dell'attività vocale per l'inizio del parlato continueranno a essere applicati. I timeout per l'attività vocale relativi alla fine del parlato non verranno applicati, poiché lo stream verrà chiuso non appena l'enunciazione termina.