Panduan ini memberikan setelan lanjutan tambahan untuk fitur ucapan. Anda dapat mengaktifkan dan menonaktifkan setelan lanjutan ini dengan membuka Setelan agen > Speech and IVR > Speech-to-Text > Advanced speech settings.
Setelan ini tersedia di setelan agen (berlaku untuk seluruh agen), setelan alur (berlaku untuk seluruh alur dan menggantikan setelan agen), setelan halaman (berlaku untuk halaman dan menggantikan setelan alur dan agen), dan setelan pemenuhan (berlaku untuk pemenuhan dan menggantikan setelan halaman, alur, dan agen). Subkumpulan setelan ini tersedia di setiap tingkat, bergantung pada relevansi setelan untuk tingkat tersebut. *Sebelum dapat mengonfigurasi setelan ini di tingkat yang lebih rendah, Anda harus mencentang kotak Aktifkan setelan ucapan lanjutan di tingkat agen terlebih dahulu (Setelan agen > Ucapan dan IVR > Speech-to-Text > Setelan ucapan lanjutan)*.
Setelan tingkat agen yang diperbarui tidak diteruskan ke tingkat alur, halaman, dan pemenuhan jika opsi Sesuaikan dipilih di tingkat yang lebih rendah ini. Jika opsi Sesuaikan mencakup beberapa setelan dan Anda hanya ingin memperbarui beberapa setelan, Anda mungkin juga perlu memperbarui setelan lainnya jika ingin setelan tersebut sama dengan setelan tingkat agen.
Ketersediaan setelan menurut tingkat
Tabel berikut menunjukkan setelan ucapan lanjutan yang tersedia di setiap tingkat:
Nama setelan | Agen | Flow | Halaman | Fulfillment |
---|---|---|---|---|
Pemilihan model (Speech-to-Text) | ✔ | ✔ | ✔ | |
Sensitivitas akhir ucapan | ✔ | ✔ | ✔ | |
Sensitivitas akhir ucapan lanjutan berbasis waktu tunggu | ✔ | ✔ | ✔ | |
Mengaktifkan endpoint pintar | ✔ | |||
Waktu tunggu tanpa ucapan | ✔ | ✔ | ✔ | |
Menyela | ✔ | ✔ | ✔ | |
Mengizinkan pembatalan pemutaran respons parsial | ✔ | |||
Bucket ekspor audio | ✔ | ✔ | ||
DTMF | ✔ | ✔ | ✔ |
Pemilihan model (Speech-to-Text)
Dapat ditetapkan di tingkat agen, alur, dan halaman.
Menetapkan model ucapan yang digunakan untuk pengenalan ucapan. Setelan ini khusus untuk bahasa tertentu, sehingga Anda dapat memilih model yang berbeda untuk bahasa yang berbeda. Anda juga dapat mencentang Ganti model ucapan tingkat permintaan, yang akan menyebabkan model yang dipilih digunakan meskipun panggilan API runtime menentukan model yang berbeda.
Untuk Gateway Telepon Agen Percakapan (Dialogflow CX), lihat batasan. Untuk mengetahui informasi selengkapnya, lihat Model ucapan.
Sensitivitas akhir ucapan
Dapat ditetapkan di tingkat agen, alur, dan halaman.
Mengontrol sensitivitas untuk mengenali akhir ucapan dalam input audio pengguna akhir. Nilai berkisar dari 0 (sensitivitas rendah, lebih kecil kemungkinannya untuk mengakhiri ucapan) hingga 100 (sensitivitas tinggi, lebih besar kemungkinannya untuk mengakhiri ucapan).
Sensitivitas akhir ucapan lanjutan berbasis waktu tunggu
Dapat ditetapkan di tingkat agen dan dinonaktifkan di tingkat alur dan halaman.
Jika setelan ini diaktifkan, nilai setelan Sensitivitas akhir ucapan akan digunakan sebagai tolok ukur untuk menetapkan waktu tunggu senyap audio relatif guna menentukan akhir ucapan. Jika setelan ini dinonaktifkan (default), nilai setelan Sensitivitas akhir ucapan digunakan untuk menentukan akhir ucapan oleh model ML yang disediakan oleh Google Cloud Speech-to-Text.
Meskipun setelan Sensitivitas akhir ucapan hanya mendukung model ucapan phone_call
untuk tag bahasa en-US
secara default, setelan Aktifkan sensitivitas akhir ucapan lanjutan berbasis waktu tunggu memungkinkan konfigurasi sensitivitas akhir ucapan untuk semua bahasa dan model ucapan yang didukung oleh Dialogflow.
Mengaktifkan endpoint pintar
Hanya dapat ditetapkan di tingkat agen.
Jika setelan ini diaktifkan, Agen Percakapan (Dialogflow CX) akan menganalisis input pengguna parsial untuk menentukan akhir ucapan. Misalnya, jika pengguna mengatakan "Saya ingin" dan berhenti sejenak, Agen Percakapan (Dialogflow CX) akan menunggu pengguna melanjutkan kalimat.
Hal ini sangat berguna untuk pengumpulan parameter numerik, di mana pengguna dapat mengucapkan "1234" dan berhenti sebelum mengucapkan "5678". Untuk menerapkan setelan ini untuk parameter tertentu, Anda harus menyiapkan Pengakhiran cerdas di formulir parameter.
Setelan ini hanya tersedia untuk tag bahasa en-US
dan dinonaktifkan secara
default.
Waktu tunggu tanpa ucapan
Dapat ditetapkan di tingkat agen, alur, dan halaman.
Durasi waktu dalam detik saat Agen Percakapan (Dialogflow CX) akan berhenti menunggu input audio pengguna akhir. Defaultnya adalah 5 detik, dan nilai maksimumnya adalah 60 detik. Untuk waktu tunggu ini, Agen Percakapan (Dialogflow CX) memanggil peristiwa tanpa input.
Menyela
Dapat ditetapkan di tingkat agen, alur, dan pemenuhan.
Jika diaktifkan, pengguna akhir dapat menghentikan audio respons Agen Percakapan (Dialogflow CX). Jika terganggu, Agen Percakapan (Dialogflow CX) akan berhenti mengirimkan audio, dan akan memproses input pengguna akhir berikutnya.
Jika ada beberapa pesan dalam antrean pesan, dan pesan dimasukkan dalam antrean oleh pemenuhan yang terkait dengan halaman, alur, atau agen yang mengaktifkan interupsi, maka semua pesan berikutnya dalam antrean juga akan mengaktifkan interupsi. Dalam hal ini, integrasi akan berhenti memutar audio untuk semua pesan dalam antrean dengan fitur interupsi diaktifkan.
Mengizinkan pembatalan pemutaran respons parsial
Hanya dapat ditetapkan di tingkat pemenuhan.
Anda dapat mengaktifkan setelan ini jika kotak Aktifkan setelan ucapan lanjutan dicentang di Setelan agen > Ucapan dan IVR dan respons parsial diaktifkan di tingkat pemenuhan. Setelan ini memungkinkan pembatalan pemutaran respons parsial.
Jika pesan dalam antrean pesan dibuat oleh pemenuhan yang memungkinkan pembatalan, pemutaran pesan akan dibatalkan jika pesan lain ditambahkan ke antrean. Hal ini berguna saat Anda ingin pesan awal memulai pemutaran, tetapi pemutaran tersebut dibatalkan jika webhook yang berfungsi menghasilkan pesan lain sebelum pemutaran pesan awal selesai.
Bucket ekspor audio
Dapat ditetapkan di tingkat agen dan alur.
Jika disediakan, semua data audio yang terkait dengan permintaan akan disimpan ke bucket Cloud Storage:
Audio Disimpan | Permintaan yang berlaku |
---|---|
Input audio pengguna akhir | DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent |
Audio Text-to-Speech (TTS) yang disintesis untuk respons | AnalyzeContent, StreamingAnalyzeContent |
Berikan peran Storage Object Creator ke akun layanan berikut dalam project Anda:
Ke akun layanan dengan format
one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.
jika Anda menggunakan integrasi telepon bawaan partner.Ke akun layanan dengan format
service-PROJECT_NUMBER@gcp-sa-dialogflow.
jika Anda menggunakan integrasi Dialogflow CX Phone Gateway. Untuk menemukan akun layanan ini di IAM, centang opsi Sertakan pemberian peran yang disediakan Google.
DTMF
Lihat dokumentasi DTMF (Dual-tone multi-frequency signaling) untuk mengetahui informasi selengkapnya tentang fitur ini.