單一語音輸入行為

Speech-to-Text 提供 latest_short 模型,可辨識由單一語音組成的語音。如果應用程式的使用者發出的是單一語音指令,而非長篇獨白或聽寫內容,這項功能就非常實用。

如果辨識要求使用 latest_short 模型,Speech-to-Text 偵測到語音結束時,就會停止執行辨識作業。語音轉文字會傳回語音活動事件回應,類型為 END_OF_SINGLE_UTTERANCE,後面接著轉錄結果。

單一語音和 StreamingRecognize

如果為 StreamingRecognize 要求選取 latest_short 模型 Recognizer,Speech-to-Text 會在語音結束後自動關閉串流。

語音活動事件

如果 StreamingRecognize 請求也啟用了語音活動事件,Speech-to-Text 仍會回傳語音開始/結束語音活動事件。系統仍會套用語音活動逾時設定。系統不會套用語音活動逾時設定,因為語音結束後,串流就會立即關閉。