Questa pagina è stata tradotta dall'API Cloud Translation.

Comportamento di un singolo enunciato

Speech-to-Text fornisce il modello latest_short per il riconoscimento vocale costituito da singole frasi. Questa funzionalità può essere utile per le applicazioni in cui gli utenti danno comandi vocali singoli anziché monologhi o dettature nel formato lungo.

Quando per una richiesta di riconoscimento viene utilizzato un riconoscitore con il modello latest_short, Speech-to-Text interrompe l'esecuzione del riconoscimento quando rileva che un'espressione è terminata. Speech-to-Text restituirà una risposta all'evento attività vocale con il tipo END_OF_SINGLE_UTTERANCE seguito dai risultati della trascrizione.

Singola espressione e StreamingRecognize

Se per una richiesta StreamingRecognize viene selezionato un modello latest_short Recognizer, Speech-to-Text chiuderà automaticamente lo stream al termine dell'enunciazione.

Con eventi di attività vocale

Se sono stati attivati anche gli eventi di attività vocale per una richiesta StreamingRecognize, Speech-to-Text restituirà comunque gli eventi di attività vocale inizio/fine del parlato. I timeout dell'attività vocale per l'inizio del parlato continueranno a essere applicati. I timeout per l'attività vocale relativi alla fine del parlato non verranno applicati, poiché lo stream verrà chiuso non appena termina l'enunciazione.