本頁面由 Cloud Translation API 翻譯而成。

單一語音輸入行為

Speech-to-Text 提供 latest_short 模型，可辨識由單一語音組成的語音。如果應用程式的使用者發出的是單一語音指令，而非長篇獨白或聽寫內容，這項功能就非常實用。

如果辨識要求使用 latest_short 模型，Speech-to-Text 偵測到語音結束時，就會停止執行辨識作業。語音轉文字會傳回語音活動事件回應，類型為 END_OF_SINGLE_UTTERANCE，後面接著轉錄結果。

單一語音和 StreamingRecognize

如果為 StreamingRecognize 要求選取 latest_short 模型 Recognizer，Speech-to-Text 會在語音結束後自動關閉串流。

如果 StreamingRecognize 請求也啟用了語音活動事件，Speech-to-Text 仍會回傳語音開始/結束語音活動事件。系統仍會套用語音活動逾時設定。系統不會套用語音活動逾時設定，因為語音結束後，串流就會立即關閉。