Perilaku ucapan tunggal

Speech-to-Text menyediakan model latest_short untuk mengenali ucapan yang terdiri dari satu ucapan. Model ini berfungsi ketika pengguna mengeluarkan satu perintah suara, bukan monolog atau dikte berdurasi panjang.

Saat pengenal dengan model latest_short digunakan untuk permintaan pengenalan, Speech-to-Text akan berhenti melakukan pengenalan setelah mendeteksi bahwa ucapan telah selesai. Speech-to-Text akan menampilkan respons peristiwa aktivitas ucapan dengan jenis END_OF_SINGLE_UTTERANCE diikuti dengan hasil transkripsi.

Ucapan tunggal dan StreamingRecognize

Jika model latest_short Recognizer dipilih untuk permintaan StreamingRecognize, Speech-to-Text akan menutup streaming secara otomatis setelah ucapan berakhir.

Dengan peristiwa aktivitas suara

Jika peristiwa aktivitas suara juga telah diaktifkan untuk permintaan StreamingRecognize, Speech-to-Text akan tetap menampilkan peristiwa aktivitas suara mulai/akhir ucapan. Waktu tunggu aktivitas suara untuk memulai ucapan akan tetap diterapkan. Waktu tunggu aktivitas suara untuk akhir ucapan tidak akan diterapkan karena streaming akan diakhiri segera setelah ucapan berakhir.