Speech-to-Text fornisce il modello latest_short
per il riconoscimento del parlato costituito da singole espressioni. Questo può essere utile per le applicazioni in cui gli utenti
inviano singoli comandi vocali, anziché un monologo o
la dettatura nel formato lungo.
Quando per una richiesta di riconoscimento viene utilizzato un riconoscimento con il modello latest_short
, Speech-to-Text interromperà l'esecuzione del riconoscimento quando rileva che un'espressione è terminata. Speech-to-Text restituirà una risposta all'evento di attività vocale con il tipo END_OF_SINGLE_UTTERANCE
seguito dai risultati della trascrizione.
Espressione singola e StreamingRecognize
Nel caso in cui venga selezionato un modello latest_short
Recognizer
per una richiesta StreamingRecognize
, Speech-to-Text chiuderà automaticamente il flusso al termine dell'espressione.
Con eventi di attività vocale
Nel caso in cui siano stati abilitati anche eventi di attività vocale per una richiesta StreamingingRecognize, Speech-to-Text restituirà comunque gli eventi dell'attività vocale di inizio/fine della voce. I timeout dell'attività vocale per l'inizio della voce verranno comunque applicati. I timeout dell'attività vocale per la fine della voce non verranno applicati, poiché lo stream verrà chiuso non appena termina l'espressione.