Panduan ini memberikan setelan lanjutan tambahan untuk fitur ucapan. Anda dapat menonaktifkan dan mengaktifkan setelan lanjutan ini dengan membuka Setelan agen > Ucapan dan IVR > Ucapan ke Teks > Setelan ucapan lanjutan.
Setelan ini tersedia di setelan agen (berlaku untuk seluruh agen), setelan alur (berlaku untuk seluruh alur dan mengganti setelan agen), setelan halaman (berlaku untuk halaman dan mengganti setelan alur dan agen), serta setelan fulfillment (berlaku untuk fulfillment dan mengganti setelan halaman, alur, dan agen). Subkumpulan setelan ini tersedia di setiap tingkat, bergantung pada relevansi setelan untuk tingkat tersebut. *Sebelum dapat mengonfigurasi setelan ini di tingkat yang lebih rendah, Anda harus mencentang kotak Enable advanced speech settings terlebih dahulu di tingkat agen (Agent settings > Speech and IVR > Speech-to-Text > Advanced speech settings)*.
Setelan tingkat agen yang diperbarui tidak diterapkan ke tingkat alur, halaman, dan fulfillment saat opsi Sesuaikan dipilih di tingkat yang lebih rendah ini. Jika opsi Sesuaikan mencakup beberapa setelan dan Anda hanya ingin memperbarui beberapa setelan, Anda mungkin juga perlu memperbarui setelan lain jika ingin setelan tersebut sama dengan setelan tingkat agen.
Ketersediaan setelan menurut tingkat
Tabel berikut menunjukkan setelan ucapan lanjutan yang tersedia di setiap tingkat:
Nama setelan | Agen | Flow | Halaman | Fulfillment |
---|---|---|---|---|
Pemilihan model (Speech-to-Text) | ✔ | ✔ | ✔ | |
Sensitivitas akhir ucapan | ✔ | ✔ | ✔ | |
Sensitivitas akhir ucapan lanjutan berbasis waktu tunggu | ✔ | ✔ | ✔ | |
Mengaktifkan endpointing pintar | ✔ | |||
Tidak ada waktu tunggu ucapan | ✔ | ✔ | ✔ | |
Barge-in | ✔ | ✔ | ||
Mengizinkan pembatalan pemutaran respons sebagian | ✔ | |||
Bucket ekspor audio | ✔ | ✔ | ||
DTMF | ✔ | ✔ | ✔ |
Pemilihan model (Speech-to-Text)
Dapat ditetapkan di tingkat agen, alur, dan halaman.
Menetapkan model ucapan yang digunakan untuk pengenalan ucapan. Setelan ini bersifat khusus bahasa, sehingga Anda dapat memilih model yang berbeda untuk bahasa yang berbeda. Anda juga dapat mencentang Ganti model ucapan tingkat permintaan, yang akan menyebabkan model yang dipilih digunakan meskipun panggilan API runtime menentukan model yang berbeda.
Untuk Gateway Telepon Agen Percakapan (Dialogflow CX), lihat batasan. Untuk mengetahui informasi selengkapnya, lihat Model ucapan.
Sensitivitas akhir ucapan
Dapat ditetapkan di tingkat agen, alur, dan halaman.
Mengontrol sensitivitas untuk mengenali akhir ucapan dalam input audio pengguna akhir. Nilainya berkisar dari 0 (sensitivitas rendah, lebih kecil kemungkinannya untuk mengakhiri ucapan) hingga 100 (sensitivitas tinggi, lebih besar kemungkinannya untuk mengakhiri ucapan).
Sensitivitas akhir ucapan lanjutan berbasis waktu tunggu
Dapat ditetapkan di tingkat agen dan dinonaktifkan di tingkat alur dan halaman.
Jika setelan ini diaktifkan, nilai setelan Keseluruhan sensitivitas ucapan akan digunakan sebagai pengukur untuk menetapkan waktu tunggu senyap audio relatif guna menentukan akhir ucapan. Jika setelan ini dinonaktifkan (default), nilai setelan Keseimbangan akhir ucapan akan digunakan untuk menentukan akhir ucapan oleh model ML yang disediakan oleh Google Cloud Speech-to-Text.
Meskipun setelan Keseluruhan sensitivitas ucapan hanya mendukung model ucapan phone_call
untuk tag language
en-US
secara default, setelan Aktifkan sensitivitas akhir ucapan lanjutan berbasis waktu tunggu
memungkinkan konfigurasi sensitivitas akhir ucapan untuk semua bahasa dan
model ucapan yang didukung oleh Dialogflow.
Mengaktifkan endpointing pintar
Hanya dapat ditetapkan di tingkat agen.
Jika setelan ini diaktifkan, Agen Percakapan (Dialogflow CX) akan menganalisis input pengguna sebagian untuk menentukan akhir ucapan. Misalnya, jika pengguna mengucapkan "Saya ingin" dan berhenti sejenak, Agen Percakapan (Dialogflow CX) akan menunggu pengguna melanjutkan kalimat.
Hal ini sangat berguna untuk pengumpulan parameter numerik, saat pengguna mungkin mengucapkan "1234" dan berhenti sejenak sebelum mengucapkan "5678". Untuk menerapkan setelan ini untuk parameter tertentu, Anda harus menyiapkan Endpointing cerdas di formulir parameter.
Setelan ini hanya tersedia untuk tag bahasa en-US
dan dinonaktifkan secara
default.
Tidak ada waktu tunggu ucapan
Dapat ditetapkan di tingkat agen, alur, dan halaman.
Durasi waktu dalam detik saat Agen Percakapan (Dialogflow CX) akan berhenti menunggu input audio pengguna akhir. Nilai defaultnya adalah 5 detik, dan nilai maksimumnya adalah 60 detik. Untuk waktu tunggu ini, Agen Percakapan (Dialogflow CX) memanggil peristiwa tanpa input.
Barge-in
Dapat ditetapkan di tingkat agen, alur, dan fulfillment.
Jika diaktifkan, pengguna akhir dapat mengganggu audio respons Agen Percakapan (Dialogflow CX). Jika terganggu, Agen Percakapan (Dialogflow CX) akan berhenti mengirim audio, dan akan memproses input pengguna akhir berikutnya.
Jika ada beberapa pesan dalam antrean pesan, dan pesan dimasukkan dalam antrean oleh fulfillment yang terkait dengan halaman, alur, atau agen yang mengaktifkan barge-in, semua pesan berikutnya dalam antrean juga akan mengaktifkan barge-in. Dalam hal ini, integrasi akan berhenti memutar audio untuk semua pesan yang diantrekan dengan mengaktifkan barge-in.
Mengizinkan pembatalan pemutaran respons sebagian
Hanya dapat ditetapkan di tingkat fulfillment.
Anda dapat mengaktifkan setelan ini jika kotak Aktifkan setelan ucapan lanjutan disetel di Setelan agen > Ucapan dan IVR dan respons sebagian diaktifkan di tingkat fulfillment. Setelan ini memungkinkan pembatalan pemutaran respons sebagian.
Jika pesan di antrean pesan dibuat oleh fulfillment yang memungkinkan pembatalan, pemutaran pesan akan dibatalkan jika pesan lain ditambahkan ke antrean. Hal ini berguna jika Anda ingin pesan awal memulai pemutaran, tetapi pemutaran tersebut dibatalkan jika webhook yang berfungsi menghasilkan pesan lain sebelum pemutaran pesan awal selesai.
Bucket ekspor audio
Dapat ditetapkan di tingkat agen dan alur.
Jika disediakan, data audio apa pun yang terkait dengan permintaan akan disimpan ke bucket Cloud Storage:
Audio Disimpan | Permintaan yang berlaku |
---|---|
Input audio pengguna akhir | DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent |
Audio Text-to-Speech (TTS) yang disintesis untuk respons | AnalyzeContent, StreamingAnalyzeContent |
Berikan peran Storage Object Creator ke akun layanan berikut di project Anda:
Ke akun layanan dengan format
one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.
jika Anda menggunakan integrasi telepon bawaan partner.Ke akun layanan dengan format
service-PROJECT_NUMBER@gcp-sa-dialogflow.
jika Anda menggunakan integrasi Gateway Telepon Dialogflow CX. Untuk menemukan akun layanan ini di IAM, centang opsi Sertakan pemberian peran yang disediakan Google.
DTMF
Lihat dokumentasi DTMF (Sinyal multifrekuensi nada ganda) untuk mengetahui informasi selengkapnya tentang fitur ini.