Comportamento a frase singola

Speech-to-Text fornisce il modello latest_short per il riconoscimento del parlato costituito da singole espressioni. Questo può essere utile per le applicazioni in cui gli utenti inviano singoli comandi vocali, anziché un monologo o la dettatura nel formato lungo.

Quando per una richiesta di riconoscimento viene utilizzato un riconoscimento con il modello latest_short, Speech-to-Text interromperà l'esecuzione del riconoscimento quando rileva che un'espressione è terminata. Speech-to-Text restituirà una risposta all'evento di attività vocale con il tipo END_OF_SINGLE_UTTERANCE seguito dai risultati della trascrizione.

Espressione singola e StreamingRecognize

Nel caso in cui venga selezionato un modello latest_short Recognizer per una richiesta StreamingRecognize, Speech-to-Text chiuderà automaticamente il flusso al termine dell'espressione.

Con eventi di attività vocale

Nel caso in cui siano stati abilitati anche eventi di attività vocale per una richiesta StreamingingRecognize, Speech-to-Text restituirà comunque gli eventi dell'attività vocale di inizio/fine della voce. I timeout dell'attività vocale per l'inizio della voce verranno comunque applicati. I timeout dell'attività vocale per la fine della voce non verranno applicati, poiché lo stream verrà chiuso non appena termina l'espressione.