Setelan ucapan lanjutan

Panduan ini memberikan setelan lanjutan tambahan untuk fitur ucapan. Anda dapat menonaktifkan dan mengaktifkan setelan lanjutan ini dengan membuka Setelan agen > Ucapan dan IVR > Ucapan ke Teks > Setelan ucapan lanjutan.

Setelan ini tersedia di setelan agen (berlaku untuk seluruh agen), setelan alur (berlaku untuk seluruh alur dan mengganti setelan agen), setelan halaman (berlaku untuk halaman dan mengganti setelan alur dan agen), serta setelan fulfillment (berlaku untuk fulfillment dan mengganti setelan halaman, alur, dan agen). Subkumpulan setelan ini tersedia di setiap tingkat, bergantung pada relevansi setelan untuk tingkat tersebut. *Sebelum dapat mengonfigurasi setelan ini di tingkat yang lebih rendah, Anda harus mencentang kotak Enable advanced speech settings terlebih dahulu di tingkat agen (Agent settings > Speech and IVR > Speech-to-Text > Advanced speech settings)*.

Setelan tingkat agen yang diperbarui tidak diterapkan ke tingkat alur, halaman, dan fulfillment saat opsi Sesuaikan dipilih di tingkat yang lebih rendah ini. Jika opsi Sesuaikan mencakup beberapa setelan dan Anda hanya ingin memperbarui beberapa setelan, Anda mungkin juga perlu memperbarui setelan lain jika ingin setelan tersebut sama dengan setelan tingkat agen.

Ketersediaan setelan menurut tingkat

Tabel berikut menunjukkan setelan ucapan lanjutan yang tersedia di setiap tingkat:

Nama setelan Agen Flow Halaman Fulfillment
Pemilihan model (Speech-to-Text)
Sensitivitas akhir ucapan
Sensitivitas akhir ucapan lanjutan berbasis waktu tunggu
Mengaktifkan endpointing pintar
Tidak ada waktu tunggu ucapan
Barge-in
Mengizinkan pembatalan pemutaran respons sebagian
Bucket ekspor audio
DTMF

Pemilihan model (Speech-to-Text)

Dapat ditetapkan di tingkat agen, alur, dan halaman.

Menetapkan model ucapan yang digunakan untuk pengenalan ucapan. Setelan ini bersifat khusus bahasa, sehingga Anda dapat memilih model yang berbeda untuk bahasa yang berbeda. Anda juga dapat mencentang Ganti model ucapan tingkat permintaan, yang akan menyebabkan model yang dipilih digunakan meskipun panggilan API runtime menentukan model yang berbeda.

Untuk Gateway Telepon Agen Percakapan (Dialogflow CX), lihat batasan. Untuk mengetahui informasi selengkapnya, lihat Model ucapan.

Sensitivitas akhir ucapan

Dapat ditetapkan di tingkat agen, alur, dan halaman.

Mengontrol sensitivitas untuk mengenali akhir ucapan dalam input audio pengguna akhir. Nilainya berkisar dari 0 (sensitivitas rendah, lebih kecil kemungkinannya untuk mengakhiri ucapan) hingga 100 (sensitivitas tinggi, lebih besar kemungkinannya untuk mengakhiri ucapan).

Sensitivitas akhir ucapan lanjutan berbasis waktu tunggu

Dapat ditetapkan di tingkat agen dan dinonaktifkan di tingkat alur dan halaman.

Jika setelan ini diaktifkan, nilai setelan Keseluruhan sensitivitas ucapan akan digunakan sebagai pengukur untuk menetapkan waktu tunggu senyap audio relatif guna menentukan akhir ucapan. Jika setelan ini dinonaktifkan (default), nilai setelan Keseimbangan akhir ucapan akan digunakan untuk menentukan akhir ucapan oleh model ML yang disediakan oleh Google Cloud Speech-to-Text.

Meskipun setelan Keseluruhan sensitivitas ucapan hanya mendukung model ucapan phone_call untuk tag language en-US secara default, setelan Aktifkan sensitivitas akhir ucapan lanjutan berbasis waktu tunggu memungkinkan konfigurasi sensitivitas akhir ucapan untuk semua bahasa dan model ucapan yang didukung oleh Dialogflow.

Mengaktifkan endpointing pintar

Hanya dapat ditetapkan di tingkat agen.

Jika setelan ini diaktifkan, Agen Percakapan (Dialogflow CX) akan menganalisis input pengguna sebagian untuk menentukan akhir ucapan. Misalnya, jika pengguna mengucapkan "Saya ingin" dan berhenti sejenak, Agen Percakapan (Dialogflow CX) akan menunggu pengguna melanjutkan kalimat.

Hal ini sangat berguna untuk pengumpulan parameter numerik, saat pengguna mungkin mengucapkan "1234" dan berhenti sejenak sebelum mengucapkan "5678". Untuk menerapkan setelan ini untuk parameter tertentu, Anda harus menyiapkan Endpointing cerdas di formulir parameter.

Setelan ini hanya tersedia untuk tag bahasa en-US dan dinonaktifkan secara default.

Tidak ada waktu tunggu ucapan

Dapat ditetapkan di tingkat agen, alur, dan halaman.

Durasi waktu dalam detik saat Agen Percakapan (Dialogflow CX) akan berhenti menunggu input audio pengguna akhir. Nilai defaultnya adalah 5 detik, dan nilai maksimumnya adalah 60 detik. Untuk waktu tunggu ini, Agen Percakapan (Dialogflow CX) memanggil peristiwa tanpa input.

Barge-in

Dapat ditetapkan di tingkat agen, alur, dan fulfillment.

Jika diaktifkan, pengguna akhir dapat mengganggu audio respons Agen Percakapan (Dialogflow CX). Jika terganggu, Agen Percakapan (Dialogflow CX) akan berhenti mengirim audio, dan akan memproses input pengguna akhir berikutnya.

Jika ada beberapa pesan dalam antrean pesan, dan pesan dimasukkan dalam antrean oleh fulfillment yang terkait dengan halaman, alur, atau agen yang mengaktifkan barge-in, semua pesan berikutnya dalam antrean juga akan mengaktifkan barge-in. Dalam hal ini, integrasi akan berhenti memutar audio untuk semua pesan yang diantrekan dengan mengaktifkan barge-in.

Mengizinkan pembatalan pemutaran respons sebagian

Hanya dapat ditetapkan di tingkat fulfillment.

Anda dapat mengaktifkan setelan ini jika kotak Aktifkan setelan ucapan lanjutan disetel di Setelan agen > Ucapan dan IVR dan respons sebagian diaktifkan di tingkat fulfillment. Setelan ini memungkinkan pembatalan pemutaran respons sebagian.

Jika pesan di antrean pesan dibuat oleh fulfillment yang memungkinkan pembatalan, pemutaran pesan akan dibatalkan jika pesan lain ditambahkan ke antrean. Hal ini berguna jika Anda ingin pesan awal memulai pemutaran, tetapi pemutaran tersebut dibatalkan jika webhook yang berfungsi menghasilkan pesan lain sebelum pemutaran pesan awal selesai.

Bucket ekspor audio

Dapat ditetapkan di tingkat agen dan alur.

Jika disediakan, data audio apa pun yang terkait dengan permintaan akan disimpan ke bucket Cloud Storage:

Audio Disimpan Permintaan yang berlaku
Input audio pengguna akhir DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent
Audio Text-to-Speech (TTS) yang disintesis untuk respons AnalyzeContent, StreamingAnalyzeContent

Berikan peran Storage Object Creator ke akun layanan berikut di project Anda:

  • Ke akun layanan dengan format one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE. jika Anda menggunakan integrasi telepon bawaan partner.

  • Ke akun layanan dengan format service-PROJECT_NUMBER@gcp-sa-dialogflow. jika Anda menggunakan integrasi Gateway Telepon Dialogflow CX. Untuk menemukan akun layanan ini di IAM, centang opsi Sertakan pemberian peran yang disediakan Google.

DTMF

Lihat dokumentasi DTMF (Sinyal multifrekuensi nada ganda) untuk mengetahui informasi selengkapnya tentang fitur ini.