Setelan ucapan lanjutan

Panduan ini memberikan setelan lanjutan tambahan untuk fitur ucapan. Anda dapat mengaktifkan dan menonaktifkan setelan lanjutan ini dengan membuka Setelan agen > Speech and IVR > Speech-to-Text > Advanced speech settings.

Setelan ini tersedia di setelan agen (berlaku untuk seluruh agen), setelan alur (berlaku untuk seluruh alur dan menggantikan setelan agen), setelan halaman (berlaku untuk halaman dan menggantikan setelan alur dan agen), dan setelan pemenuhan (berlaku untuk pemenuhan dan menggantikan setelan halaman, alur, dan agen). Subkumpulan setelan ini tersedia di setiap tingkat, bergantung pada relevansi setelan untuk tingkat tersebut. *Sebelum dapat mengonfigurasi setelan ini di tingkat yang lebih rendah, Anda harus mencentang kotak Aktifkan setelan ucapan lanjutan di tingkat agen terlebih dahulu (Setelan agen > Ucapan dan IVR > Speech-to-Text > Setelan ucapan lanjutan)*.

Setelan tingkat agen yang diperbarui tidak diteruskan ke tingkat alur, halaman, dan pemenuhan jika opsi Sesuaikan dipilih di tingkat yang lebih rendah ini. Jika opsi Sesuaikan mencakup beberapa setelan dan Anda hanya ingin memperbarui beberapa setelan, Anda mungkin juga perlu memperbarui setelan lainnya jika ingin setelan tersebut sama dengan setelan tingkat agen.

Ketersediaan setelan menurut tingkat

Tabel berikut menunjukkan setelan ucapan lanjutan yang tersedia di setiap tingkat:

Nama setelan Agen Flow Halaman Fulfillment
Pemilihan model (Speech-to-Text)
Sensitivitas akhir ucapan
Sensitivitas akhir ucapan lanjutan berbasis waktu tunggu
Mengaktifkan endpoint pintar
Waktu tunggu tanpa ucapan
Menyela
Mengizinkan pembatalan pemutaran respons parsial
Bucket ekspor audio
DTMF

Pemilihan model (Speech-to-Text)

Dapat ditetapkan di tingkat agen, alur, dan halaman.

Menetapkan model ucapan yang digunakan untuk pengenalan ucapan. Setelan ini khusus untuk bahasa tertentu, sehingga Anda dapat memilih model yang berbeda untuk bahasa yang berbeda. Anda juga dapat mencentang Ganti model ucapan tingkat permintaan, yang akan menyebabkan model yang dipilih digunakan meskipun panggilan API runtime menentukan model yang berbeda.

Untuk Gateway Telepon Agen Percakapan (Dialogflow CX), lihat batasan. Untuk mengetahui informasi selengkapnya, lihat Model ucapan.

Sensitivitas akhir ucapan

Dapat ditetapkan di tingkat agen, alur, dan halaman.

Mengontrol sensitivitas untuk mengenali akhir ucapan dalam input audio pengguna akhir. Nilai berkisar dari 0 (sensitivitas rendah, lebih kecil kemungkinannya untuk mengakhiri ucapan) hingga 100 (sensitivitas tinggi, lebih besar kemungkinannya untuk mengakhiri ucapan).

Sensitivitas akhir ucapan lanjutan berbasis waktu tunggu

Dapat ditetapkan di tingkat agen dan dinonaktifkan di tingkat alur dan halaman.

Jika setelan ini diaktifkan, nilai setelan Sensitivitas akhir ucapan akan digunakan sebagai tolok ukur untuk menetapkan waktu tunggu senyap audio relatif guna menentukan akhir ucapan. Jika setelan ini dinonaktifkan (default), nilai setelan Sensitivitas akhir ucapan digunakan untuk menentukan akhir ucapan oleh model ML yang disediakan oleh Google Cloud Speech-to-Text.

Meskipun setelan Sensitivitas akhir ucapan hanya mendukung model ucapan phone_call untuk tag bahasa en-US secara default, setelan Aktifkan sensitivitas akhir ucapan lanjutan berbasis waktu tunggu memungkinkan konfigurasi sensitivitas akhir ucapan untuk semua bahasa dan model ucapan yang didukung oleh Dialogflow.

Mengaktifkan endpoint pintar

Hanya dapat ditetapkan di tingkat agen.

Jika setelan ini diaktifkan, Agen Percakapan (Dialogflow CX) akan menganalisis input pengguna parsial untuk menentukan akhir ucapan. Misalnya, jika pengguna mengatakan "Saya ingin" dan berhenti sejenak, Agen Percakapan (Dialogflow CX) akan menunggu pengguna melanjutkan kalimat.

Hal ini sangat berguna untuk pengumpulan parameter numerik, di mana pengguna dapat mengucapkan "1234" dan berhenti sebelum mengucapkan "5678". Untuk menerapkan setelan ini untuk parameter tertentu, Anda harus menyiapkan Pengakhiran cerdas di formulir parameter.

Setelan ini hanya tersedia untuk tag bahasa en-US dan dinonaktifkan secara default.

Waktu tunggu tanpa ucapan

Dapat ditetapkan di tingkat agen, alur, dan halaman.

Durasi waktu dalam detik saat Agen Percakapan (Dialogflow CX) akan berhenti menunggu input audio pengguna akhir. Defaultnya adalah 5 detik, dan nilai maksimumnya adalah 60 detik. Untuk waktu tunggu ini, Agen Percakapan (Dialogflow CX) memanggil peristiwa tanpa input.

Menyela

Dapat ditetapkan di tingkat agen, alur, dan pemenuhan.

Jika diaktifkan, pengguna akhir dapat menghentikan audio respons Agen Percakapan (Dialogflow CX). Jika terganggu, Agen Percakapan (Dialogflow CX) akan berhenti mengirimkan audio, dan akan memproses input pengguna akhir berikutnya.

Jika ada beberapa pesan dalam antrean pesan, dan pesan dimasukkan dalam antrean oleh pemenuhan yang terkait dengan halaman, alur, atau agen yang mengaktifkan interupsi, maka semua pesan berikutnya dalam antrean juga akan mengaktifkan interupsi. Dalam hal ini, integrasi akan berhenti memutar audio untuk semua pesan dalam antrean dengan fitur interupsi diaktifkan.

Mengizinkan pembatalan pemutaran respons parsial

Hanya dapat ditetapkan di tingkat pemenuhan.

Anda dapat mengaktifkan setelan ini jika kotak Aktifkan setelan ucapan lanjutan dicentang di Setelan agen > Ucapan dan IVR dan respons parsial diaktifkan di tingkat pemenuhan. Setelan ini memungkinkan pembatalan pemutaran respons parsial.

Jika pesan dalam antrean pesan dibuat oleh pemenuhan yang memungkinkan pembatalan, pemutaran pesan akan dibatalkan jika pesan lain ditambahkan ke antrean. Hal ini berguna saat Anda ingin pesan awal memulai pemutaran, tetapi pemutaran tersebut dibatalkan jika webhook yang berfungsi menghasilkan pesan lain sebelum pemutaran pesan awal selesai.

Bucket ekspor audio

Dapat ditetapkan di tingkat agen dan alur.

Jika disediakan, semua data audio yang terkait dengan permintaan akan disimpan ke bucket Cloud Storage:

Audio Disimpan Permintaan yang berlaku
Input audio pengguna akhir DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent
Audio Text-to-Speech (TTS) yang disintesis untuk respons AnalyzeContent, StreamingAnalyzeContent

Berikan peran Storage Object Creator ke akun layanan berikut dalam project Anda:

  • Ke akun layanan dengan format one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE. jika Anda menggunakan integrasi telepon bawaan partner.

  • Ke akun layanan dengan format service-PROJECT_NUMBER@gcp-sa-dialogflow. jika Anda menggunakan integrasi Dialogflow CX Phone Gateway. Untuk menemukan akun layanan ini di IAM, centang opsi Sertakan pemberian peran yang disediakan Google.

DTMF

Lihat dokumentasi DTMF (Dual-tone multi-frequency signaling) untuk mengetahui informasi selengkapnya tentang fitur ini.