Comportamento de comando único

O Speech-to-Text fornece o modelo latest_short para reconhecer a voz que consiste em expressões únicas. Isto pode ser útil para aplicações em que os utilizadores estão a emitir comandos de voz únicos em vez de monólogos longos ou ditados.

Quando um reconhecedor com o modelo latest_short é usado para um pedido de reconhecimento, o Speech-to-Text deixa de realizar o reconhecimento assim que deteta que uma expressão terminou. A conversão de voz em texto devolve uma resposta de evento de atividade de voz com o tipo END_OF_SINGLE_UTTERANCE seguido dos resultados da transcrição.

Expressão única e StreamingRecognize

No caso em que um modelo latest_shortRecognizer é selecionado para um pedido StreamingRecognize, o Speech-to-Text fecha automaticamente a stream após o fim da expressão.

Com eventos de atividade de voz

No caso em que os eventos de atividade de voz também tenham sido ativados para um pedido StreamingRecognize, o Speech-to-Text continua a devolver eventos de atividade de voz de início/fim de voz. Os limites de tempo de atividade de voz para o início da fala continuam a ser aplicados. Os limites de tempo de atividade de voz para o fim da fala não são aplicados, uma vez que a stream é fechada assim que a expressão termina.