A Speech-to-Text oferece o modelo latest_short
para reconhecimento de fala
que consiste em declarações únicas. Isso pode ser útil para aplicativos em que os usuários
emitem comandos de voz únicos, em vez de monólogos ou
ditado de formato longo.
Quando um reconhecedor com o modelo latest_short
é usado para uma solicitação
de reconhecimento, a Speech-to-Text deixará de executar o reconhecimento assim que detectar
que um enunciado foi concluído. A Speech-to-Text retorna uma resposta de evento
de atividade de fala com o tipo END_OF_SINGLE_UTTERANCE
seguido pelos
resultados da transcrição.
Emissão única e StreamingRecognize
Caso o modelo latest_short
Recognizer
seja selecionado para uma solicitação StreamingRecognize
, a Speech-to-Text fechará
o stream automaticamente após a expressão ser finalizada.
Com eventos de atividade de voz
Caso os eventos de atividade de voz também tenham sido ativados para uma solicitação StreamingRecognize, a Speech-to-Text ainda retornará eventos de início e fim da atividade de voz. Os tempos limite de atividade de voz para o início da fala ainda serão aplicados. Os tempos limite da atividade de voz para o término da fala não serão aplicados, já que o stream será fechado assim que a fala terminar.