Comportamento de expressão única

A Speech-to-Text oferece o modelo latest_short para reconhecimento de fala que consiste em declarações únicas. Isso pode ser útil para aplicativos em que os usuários emitem comandos de voz únicos, em vez de monólogos ou ditado de formato longo.

Quando um reconhecedor com o modelo latest_short é usado para uma solicitação de reconhecimento, a Speech-to-Text deixará de executar o reconhecimento assim que detectar que um enunciado foi concluído. A Speech-to-Text retorna uma resposta de evento de atividade de fala com o tipo END_OF_SINGLE_UTTERANCE seguido pelos resultados da transcrição.

Emissão única e StreamingRecognize

Caso o modelo latest_short Recognizer seja selecionado para uma solicitação StreamingRecognize, a Speech-to-Text fechará o stream automaticamente após a expressão ser finalizada.

Com eventos de atividade de voz

Caso os eventos de atividade de voz também tenham sido ativados para uma solicitação StreamingRecognize, a Speech-to-Text ainda retornará eventos de início e fim da atividade de voz. Os tempos limite de atividade de voz para o início da fala ainda serão aplicados. Os tempos limite da atividade de voz para o término da fala não serão aplicados, já que o stream será fechado assim que a fala terminar.