Adaptasi ucapan

Saat melakukan permintaan intent deteksi, Anda dapat menyediakan phrase_hints untuk memberikan petunjuk kepada pengenal ucapan. Petunjuk ini dapat membantu mengenali dalam status percakapan tertentu.

Adaptasi ucapan otomatis

Fitur adaptasi ucapan otomatis meningkatkan akurasi pengenalan ucapan agen Anda dengan menggunakan status percakapan secara otomatis untuk meneruskan entitas dan frasa pelatihan yang relevan sebagai petunjuk konteks ucapan untuk semua permintaan intent deteksi. Fitur ini dinonaktifkan secara default.

Mengaktifkan atau menonaktifkan adaptasi ucapan otomatis

Untuk mengaktifkan atau menonaktifkan adaptasi ucapan otomatis:

Konsol

  1. Buka Dialogflow CX Console.
  2. Pilih project GCP Anda.
  3. Pilih agen Anda.
  4. Klik Agent Settings.
  5. Klik tab Ucapan dan IVR.
  6. Aktifkan atau nonaktifkan opsi Aktifkan adaptasi ucapan otomatis.
  7. Klik Simpan.

API

Lihat metode get dan patch/update untuk jenis Agent.

Pilih protokol dan versi untuk Referensi agen:

Protocol V3 V3beta1
REST Resource agen Resource agen
RPC Antarmuka agen Antarmuka agen
C++ AgentsClient Tidak tersedia
C# AgentsClient Tidak tersedia
Go AgentsClient Tidak tersedia
Java AgentsClient AgentsClient
Node.js AgentsClient AgentsClient
PHP Tidak tersedia Tidak tersedia
Python AgentsClient AgentsClient
Ruby Tidak tersedia Tidak tersedia

Desain agen untuk peningkatan pengenalan ucapan

Dengan mengaktifkan adaptasi ucapan otomatis, Anda dapat membuat agen dengan cara memanfaatkannya. Bagian berikut menjelaskan cara pengenalan ucapan dapat ditingkatkan dengan perubahan tertentu pada frasa, dan entitas pelatihan agen Anda.

Frasa latihan

  • Jika Anda mendefinisikan frasa latihan dengan frasa seperti "hidung sesak", ucapan pengguna akhir yang mirip dapat dikenali sebagai "hidung sesak" dan bukan "hal-hal yang dia tahu".
  • Jika Anda memiliki parameter yang diperlukan yang memaksa Dialogflow ke perintah pengisian formulir, adaptasi ucapan otomatis akan sangat bias terhadap entity yang diisi.

Dalam semua kasus, adaptasi ucapan otomatis hanya membiaskan pengenalan ucapan, bukan membatasinya. Misalnya, meskipun Dialogflow meminta pengguna untuk memberikan parameter yang diperlukan, pengguna masih dapat memicu intent lain seperti intent "talk to an agent" tingkat atas.

Entitas sistem

Jika Anda mendefinisikan frasa pelatihan yang menggunakan entitas sistem @sys.number, dan pengguna akhir mengatakan "I want two", ini mungkin akan dikenali sebagai "to", "too", "2", atau "two".

Dengan mengaktifkan adaptasi ucapan otomatis, Dialogflow akan menggunakan entity @sys.number sebagai petunjuk selama pengenalan ucapan, dan parameter lebih mungkin diekstrak sebagai "2".

Entitas kustom

  • Jika Anda menentukan entitas kustom untuk nama produk atau layanan yang ditawarkan oleh perusahaan Anda, dan pengguna akhir menyebutkannya dalam ucapan, istilah tersebut akan lebih mungkin dikenali. Frasa pelatihan "I love Dialogflow", di mana "Dialogflow" dianotasikan sebagai entitas @product, akan menyampaikan adaptasi ucapan otomatis terhadap bias untuk "I love Dialogflow", "I love Cloud Speech", dan semua entri lainnya dalam entity @product.

  • Sangat penting untuk menentukan sinonim entitas yang bersih saat menggunakan Dialogflow untuk mendeteksi ucapan. Bayangkan Anda memiliki dua entri entitas @product, "Dialogflow" dan "Dataflow". Sinonim Anda untuk "Dialogflow" mungkin adalah "Dialogflow", "dialogue flow", "dialogue builder", "Speaktoit", "speak to it", "API.ai", "API dot AI". Sinonim ini adalah sinonim yang baik karena mencakup variasi yang paling umum. Anda tidak perlu menambahkan "builder alur dialog" karena "alur dialog" sudah membahasnya.

  • Ucapan pengguna dengan entitas angka yang berurutan tetapi berbeda bisa jadi ambigu. Misalnya, "Saya ingin dua enam belas paket" dapat berarti 2 jumlah dari 16 paket, atau 216 jumlah paket. Adaptasi ucapan dapat membantu membedakan kasus-kasus ini jika Anda menyiapkan entity dengan nilai yang ejaannya:
    • Tentukan entity quantity dengan entri:
      zero
      one
      ...
      twenty
    • Tentukan entity product atau size dengan entri:
      sixteen pack
      two ounce
      ...
      five liter
    • Hanya sinonim entity yang digunakan dalam adaptasi ucapan, sehingga Anda dapat menentukan entity dengan nilai referensi 1 dan sinonim tunggal one untuk menyederhanakan logika fulfillment Anda.

Entitas ekspresi reguler

Entity Regexp dapat memicu adaptasi ucapan otomatis untuk urutan alfanumerik dan digit seperti "ABC123" atau "12345" saat dikonfigurasi dan diuji dengan benar.

Untuk mengenali urutan ini melalui suara, terapkan keempat persyaratan di bawah ini:

1. Persyaratan entri ekspresi reguler

Meskipun ekspresi reguler dapat digunakan untuk mengekstrak entity dari input teks, hanya ekspresi tertentu yang akan memberi tahu adaptasi ucapan otomatis agar bias untuk urutan alfanumerik atau digit yang dieja saat mengenali ucapan.

Dalam entitas ekspresi reguler, setidaknya satu entri harus mengikuti semua aturan berikut:

  • Harus cocok dengan beberapa karakter alfanumerik, misalnya: \d, \w, [a-zA-Z0-9]
  • Tidak boleh berisi spasi kosong   atau \s, meskipun \s* dan \s? diizinkan
  • Tidak boleh berisi grup tangkapan atau non-tangkap ()
  • Tidak boleh mencoba mencocokkan karakter khusus atau tanda baca seperti: ` ~ ! @ # $ % ^ & * ( ) - _ = + , . < > / ? ; ' : " [ ] { } \ |

Entri ini dapat memiliki himpunan karakter [] dan penghitung pengulangan seperti *, ?, +, {3,5}.

Lihat Contoh.

2. Persyaratan definisi parameter

Tandai entity regexp sebagai parameter formulir yang diperlukan, sehingga dapat dikumpulkan selama pengisian formulir. Hal ini memungkinkan adaptasi ucapan otomatis agar sangat bias untuk pengenalan urutan, bukan mencoba mengenali intent dan urutan secara bersamaan. Jika tidak, "Where is my package for ABC123" mungkin salah dikenali sebagai "Where is my package 4ABC123".

3. Persyaratan anotasi frasa pelatihan

Jangan gunakan entity regexp untuk anotasi frasa pelatihan intent. Hal ini memastikan parameter diselesaikan sebagai bagian dari pengisian formulir.

4. Persyaratan pengujian

Baca artikel Menguji adaptasi ucapan.

Contoh

Misalnya, entity regexp dengan satu entri ([a-zA-Z0-9]\s?){5,9} tidak akan memicu pengenal urutan ucapan karena berisi grup tangkapan. Untuk memperbaikinya, cukup tambahkan entri lain untuk [a-zA-Z0-9]{5,9}. Sekarang Anda akan mendapatkan manfaat dari pengenal urutan saat mencocokkan "ABC123", tetapi NLU akan tetap cocok dengan input seperti "ABC 123" berkat aturan asli yang mengizinkan spasi.

Contoh ekspresi reguler berikut disesuaikan untuk urutan alfanumerik:

^[A-Za-z0-9]{1,10}$
WAC\d+
215[2-8]{3}[A-Z]+
[a-zA-Z]\s?[a-zA-Z]\s?[0-9]\s?[0-9]\s?[0-9]\s?[a-zA-Z]\s?[a-zA-Z]

Contoh ekspresi reguler berikut beradaptasi untuk urutan digit:

\d{2,8}
^[0-9]+$
2[0-9]{7}
[2-9]\d{2}[0-8]{3}\d{4}
Solusi Regexp

Dukungan bawaan adaptasi ucapan otomatis untuk entitas regexp bervariasi menurut bahasa. Periksa Token class Speech untuk mengetahui bahasa yang didukung $OOV_CLASS_ALPHANUMERIC_SEQUENCE dan $OOV_CLASS_DIGIT_SEQUENCE.

Jika bahasa Anda tidak tercantum, Anda dapat mengatasi keterbatasan ini. Misalnya, jika Anda ingin ID karyawan yang terdiri dari tiga huruf diikuti dengan tiga digit dapat dikenali secara akurat, Anda dapat membuat agen dengan entitas dan parameter berikut:

  • Tentukan entity digit yang berisi 10 entri entity (dengan sinonim):
    0, 0
    1, 1
    ...
    9, 9
  • Tentukan entity letter yang berisi 26 entri entity (dengan sinonim):
    A, A
    B, B
    ...
    Z, Z
  • Tentukan entity employee-id yang berisi satu entri entity (tanpa sinonim):
    @letter @letter @letter @digit @digit @digit
  • Gunakan @employee-id sebagai parameter dalam frasa pelatihan.

Adaptasi ucapan manual

Adaptasi ucapan manual memungkinkan Anda mengonfigurasi frasa adaptasi ucapan secara manual untuk alur atau halaman. Kode ini juga menggantikan konteks ucapan implisit yang dihasilkan oleh adaptasi ucapan otomatis saat adaptasi ucapan otomatis diaktifkan.

Setelan adaptasi ucapan tingkat halaman dan tingkat alur memiliki hubungan hierarkis, yang berarti bahwa halaman mewarisi setelan adaptasi ucapan dari tingkat alur secara default, dan tingkat halaman yang lebih mendetail selalu mengganti tingkat alur jika halaman memiliki setelan yang disesuaikan.

Untuk setelan adaptasi ucapan, setelan tingkat alur dan setelan tingkat halaman dapat diaktifkan secara terpisah. Jika setelan adaptasi tingkat alur tidak diaktifkan, Anda tetap dapat memilih Customize pada tingkat halaman untuk mengaktifkan adaptasi ucapan manual untuk halaman tersebut. Demikian pula, jika Anda menonaktifkan adaptasi ucapan manual di setelan level alur, halaman dalam alur dengan Customize dipilih tidak akan terpengaruh.

Namun, setelan tingkat alur dan setelan tingkat halaman tidak dapat dinonaktifkan secara terpisah. Jika flow mengaktifkan adaptasi ucapan manual, Anda tidak dapat menonaktifkannya untuk halaman di bawah alur melalui pilihan Customize. Oleh karena itu, jika Anda ingin memiliki berbagai penggunaan adaptasi ucapan manual dan adaptasi ucapan otomatis untuk halaman dalam alur, Anda sebaiknya tidak mengaktifkan adaptasi ucapan manual pada tingkat alur dan hanya boleh menggunakan setelan adaptasi tingkat halaman. Anda dapat melihat tabel di bawah ini untuk memahami kombinasi alur dan setelan halaman yang harus digunakan untuk adaptasi.

Efek target Rekomendasi penggunaan setelan adaptasi
Menonaktifkan adaptasi otomatis untuk flow Alur diaktifkan tanpa kumpulan frasa (halaman dalam alur secara default menggunakan setelan alur).
Menonaktifkan adaptasi otomatis untuk halaman Alur dinonaktifkan dan halaman diaktifkan (Customize dipilih) tanpa kumpulan frasa.
Hanya gunakan adaptasi ucapan manual untuk semua halaman dalam alur Flow diaktifkan. Sesuaikan halaman yang perlu menggunakan kumpulan frasa yang berbeda dari alur.
Kombinasikan penggunaan adaptasi otomatis dan manual dalam alur Flow dinonaktifkan. Sesuaikan halaman tempat Anda ingin menerapkan adaptasi manual.
Hanya gunakan adaptasi ucapan otomatis untuk semua halaman dalam alur Flow dinonaktifkan.

Mengaktifkan atau menonaktifkan adaptasi ucapan manual

Untuk mengaktifkan atau menonaktifkan adaptasi ucapan manual pada tingkat alur atau halaman:

Setelan Alur

  1. Buka Dialogflow CX Console.
  2. Pilih project GCP Anda.
  3. Arahkan kursor mouse ke flow di bagian Flow.
  4. Klik tombol opsi .
  5. Pilih Flow Settings di menu dropdown.
  6. Pilih kotak centang Aktifkan adaptasi ucapan manual atau batalkan pilihan.
  7. Mengedit, menambahkan, atau menghapus kumpulan frasa di tabel kumpulan frasa
  8. Klik Simpan.

Setelan Halaman

  1. Buka Dialogflow CX Console.
  2. Pilih project GCP Anda.
  3. Arahkan kursor mouse ke halaman di bagian Halaman.
  4. Klik tombol opsi .
  5. Pilih Page Settings di menu dropdown.
  6. Gunakan tingkat alur dipilih secara default dan saat dipilih, frasa adaptasi tingkat alur akan digunakan kembali untuk halaman ini. Anda dapat memilih Customize untuk mengonfigurasi frasa adaptasi yang berbeda dengan setelan level alur. Meskipun adaptasi ucapan manual dinonaktifkan pada tingkat alur, Anda masih dapat mengaktifkan dan mengonfigurasi adaptasi ucapan manual untuk halaman dalam alur tersebut melalui opsi Customize.
  7. Mengedit, menambahkan, atau menghapus kumpulan frasa di tabel kumpulan frasa adaptasi
  8. Klik Simpan.

Konfigurasi kumpulan frasa manual untuk peningkatan pengenalan ucapan

1. Kata dan frasa

Dalam kumpulan frasa adaptasi, Anda dapat menentukan frasa satu kata atau banyak kata dengan referensi opsional ke token class ucapan. Misalnya, Anda dapat menambahkan frasa seperti "tarif bagus", "nomor pelacakan adalah $OOV_CLASS_ALPHANUMERIC_SEQUENCE", atau "$FULLPHONENUM". Frasa yang diberikan ini meningkatkan kemungkinannya ditranskripsikan melalui frasa lain yang serupa secara fonetis. Saat Anda menambahkan frasa multi-kata tanpa peningkatan, bias diterapkan ke seluruh frasa dan bagian kontinu dalam frasa. Secara umum, jumlah frasa harus dibuat kecil dan Anda hanya boleh menambahkan frasa yang sulit dilakukan pengenalan ucapan tanpa adaptasi ucapan. Jika Speech-to-Text sudah mengenali frasa dengan benar, Anda tidak perlu menambahkan frasa ini ke setelan adaptasi ucapan. Jika melihat beberapa frasa yang sering dikenali oleh Speech-to-Text di halaman atau alur, Anda dapat menambahkan frasa yang benar ke setelan adaptasinya yang sesuai.

Contoh koreksi error pengenalan

Berikut ini contoh cara menggunakan adaptasi ucapan untuk memperbaiki masalah pengenalan. Katakanlah Anda sedang mendesain agen perdagangan perangkat telepon, dan pengguna mungkin mengatakan sesuatu termasuk frasa "jual telepon" atau "ponsel" setelah agen mengajukan pertanyaan pertamanya "bantuan apa yang Anda butuhkan?". Lalu bagaimana kita bisa menggunakan adaptasi ucapan untuk meningkatkan akurasi pengenalan pada kedua frasa?

Jika Anda menyertakan kedua frasa dalam setelan adaptasi, Speech-to-Text mungkin masih akan bingung, karena terdengar mirip. Jika Anda hanya memasukkan satu frasa dari keduanya, Speech-to-Text mungkin akan salah mengenali satu frasa sebagai frasa yang lain. Guna meningkatkan akurasi pengenalan ucapan untuk kedua frasa tersebut, Anda perlu memberikan Speech-to-Text dengan petunjuk konteks yang lebih lengkap untuk membedakan antara kapan harus mendengar "jual telepon" dan kapan seharusnya mendengar "ponsel". Misalnya, Anda mungkin melihat orang sering menggunakan "jual ponsel" sebagai bagian dari ucapan seperti "cara menjual ponsel", "ingin menjual ponsel", atau "apakah Anda menjual ponsel", sedangkan "ponsel" sebagai bagian dari ucapan seperti "beli ponsel", "tagihan ponsel", dan "layanan ponsel". Jika Anda memberikan frasa yang lebih tepat ke model, bukan frasa asli singkat "ponsel" dan "jual ponsel", Speech-to-Text akan mempelajari bahwa "jual ponsel" sebagai frasa kata kerja lebih cenderung mengikuti kata seperti "cara", "ingin", dan "lakukan", sementara "ponsel" sebagai frasa kata benda lebih cenderung mengikuti kata seperti "membeli" atau diikuti oleh kata seperti "tagihan". Oleh karena itu, sebagai pedoman untuk mengonfigurasi frasa adaptasi, sebaiknya berikan frasa yang lebih tepat seperti "cara menjual ponsel" atau "apakah Anda menjual ponsel" daripada hanya menyertakan "jual ponsel".

2. Token class ucapan

Selain kata dalam bahasa alami, Anda juga dapat menyematkan referensi ke token class ucapan ke dalam frasa. Token class ucapan mewakili konsep umum yang biasanya mengikuti format tertentu secara tertulis. Misalnya, untuk nomor alamat di alamat seperti "123 Main Street", orang biasanya berharap akan melihat format numerik nomor alamat "123" dalam alamat, bukan versi "seratus dua puluh tiga" yang dieja sepenuhnya. Jika Anda mengharapkan format tertentu dalam hasil transkripsi, terutama untuk urutan alfanumerik, lihat daftar token class yang didukung untuk mengetahui token yang tersedia untuk bahasa dan kasus penggunaan Anda.

Jika halaman sudah memiliki rute atau parameter intent dengan referensi ke entity sistem, berikut adalah tabel referensi untuk pemetaan antara entity sistem umum dan token class ucapan:

Entitas sistem Token class ucapan
@sys.date $MONTH $DAY $YEAR
@sys.date-time $MONTH $DAY $YEAR
@sys.date-period $MONTH $DAY $YEAR
@sys.time $TIME
@sys.time-period $TIME
@sys.age $OPERAND
@sys.number $OPERAND
@sys.number-integer $OPERAND
@sys.cardinal $OPERAND
@sys.ordinal $OPERAND
@sys.percentage $OPERAND
@sys.duration $OPERAND
@sys.currency-name $MONEY
@sys.unit-currency $MONEY
@sys.phone-number $FULLPHONENUM
@sys.zip-code $POSTALCODE atau $OOV_CLASS_POSTALCODE
@sys.address $ADDRESSNUM $STREET $POSTALCODE
@sys.street-address $ADDRESSNUM $STREET $POSTALCODE
@sys.temperature $OOV_CLASS_TEMPERATURE
@sys.number-sequence $OOV_CLASS_DIGIT_SEQUENCE
@sys.flight-number $OOV_CLASS_ALPHANUMERIC_SEQUENCE

3. Nilai peningkatan

Jika menambahkan frasa tanpa nilai peningkatan tidak memberikan efek pembiasan yang cukup kuat, Anda dapat menggunakan nilai peningkatan untuk lebih memperkuat efek pembiasan adaptasi ucapan.

Peningkatan menerapkan bias tambahan saat ditetapkan ke nilai yang lebih besar dari 0 dan tidak lebih dari 20. Jika peningkatan kosong atau 0, efek pembiasan default membantu mengenali seluruh frasa dan bagian berkelanjutan dalam frasa. Misalnya, frasa yang tidak ditingkatkan "apakah Anda membuka untuk menjual ponsel" membantu mengenali frasa tersebut dan juga frasa serupa seperti "Saya menjual ponsel" dan "Hai apakah Anda buka".

Ketika peningkatan positif diterapkan, efek pembiasan akan lebih kuat, tetapi hanya berlaku untuk frasa yang tepat. Misalnya, frasa yang ditingkatkan "jual ponsel" membantu mengenali "dapatkah Anda menjual ponsel", tetapi tidak "apakah Anda menjual ponsel".

Oleh karena itu, Anda akan mendapatkan hasil terbaik jika memberikan frasa dengan dan tanpa peningkatan.

Nilai boost yang lebih tinggi dapat menghasilkan negatif palsu yang lebih sedikit. Dalam kasus ini, kata atau frasa muncul dalam audio, tetapi tidak dikenali dengan benar oleh Speech-to-Text (dalam bias rendah). Namun, boost juga dapat meningkatkan kemungkinan positif palsu; yaitu, kasus saat kata atau frasa muncul dalam transkripsi meskipun tidak terjadi dalam audio (bias yang berlebihan). Anda biasanya perlu menyempurnakan frasa pembiasan untuk menemukan titik trade-off yang baik di antara kedua masalah bias.

Anda dapat mempelajari lebih lanjut cara meningkatkan nilai peningkatan untuk frasa di dokumen Cloud Speech tentang peningkatan.

Kapan harus menggunakan adaptasi ucapan otomatis atau manual

Secara umum, jika Anda tidak yakin apakah adaptasi ucapan akan meningkatkan kualitas pengenalan suara untuk agen Anda (tidak mempertimbangkan pola kesalahan transkripsi yang jelas), Anda disarankan untuk mencoba adaptasi ucapan otomatis terlebih dahulu sebelum beralih ke adaptasi ucapan manual. Untuk keputusan yang lebih berbeda, pertimbangkan faktor berikut untuk memutuskan antara adaptasi ucapan otomatis atau adaptasi ucapan manual:

1. Pengisian formulir

Adaptasi ucapan otomatis berfungsi sangat baik dengan pengisian formulir karena menggunakan konteks tata bahasa ABNF untuk parameter formulir dan menerapkan aturan tata bahasa berdasarkan jenis entitynya. Karena adaptasi ucapan manual belum mendukung tata bahasa ABNF, adaptasi Ucapan Otomatis biasanya lebih disukai daripada adaptasi ucapan manual untuk halaman pengisian formulir. Masih untuk halaman dengan hanya parameter entity sistem dan entity regexp sederhana yang didukung oleh token class ucapan, Anda juga dapat menggunakan adaptasi ucapan manual untuk mendapatkan efek bias yang mirip dengan adaptasi ucapan otomatis tanpa perlu menyesuaikan entity regexp.

2. Kompleksitas transisi halaman atau alur

Untuk halaman atau alur sederhana dengan beberapa rute intent, adaptasi ucapan otomatis kemungkinan akan menghasilkan frasa bias representatif dan berperforma cukup baik.

Namun, jika halaman atau alur memiliki banyak rute intent (untuk halaman, harap pertimbangkan juga jumlah rute tingkat alur), atau jika salah satu intent memiliki frasa pelatihan yang terlalu panjang atau pendek yang tidak penting (Misalnya, seluruh kalimat atau satu kata yang hanya terdiri dari satu atau dua suku kata), kemungkinan besar model adaptasi ucapan tidak akan berfungsi dengan baik dengan frasa ini. Anda harus mencoba menonaktifkan adaptasi ucapan untuk halaman terbuka dengan kompleksitas tinggi dengan mengaktifkan adaptasi ucapan manual dengan kumpulan frasa kosong (pengganti adaptasi kosong). Setelah itu, evaluasi apakah ada frasa khusus yang tidak ambigu yang masih perlu diberikan ke Speech-to-Text untuk meningkatkan kualitas pengenalan.

Gejala lain dari masalah kompleksitas ini adalah melihat berbagai masalah underbiasing atau overbiasing saat adaptasi ucapan otomatis diaktifkan. Serupa dengan kasus di atas, Anda juga perlu melakukan pengujian dengan adaptasi ucapan dinonaktifkan untuk halaman tertentu terlebih dahulu. Jika perilaku yang salah tetap ada setelah menonaktifkan adaptasi ucapan, Anda dapat menambahkan frasa yang ingin diperbaiki ke setelan adaptasi ucapan dan bahkan menambahkan nilai peningkatan untuk lebih memperkuat efek pembiasan jika diperlukan.

Menguji adaptasi ucapan

Saat menguji kemampuan adaptasi ucapan agen untuk pencocokan frasa pelatihan atau entity tertentu, Anda tidak boleh langsung menguji kecocokan dengan ucapan suara pertama dari percakapan. Anda hanya boleh menggunakan input suara atau peristiwa untuk seluruh percakapan sebelum pencocokan yang ingin diuji. Saat diuji dengan cara ini, perilaku agen Anda akan serupa dengan perilaku dalam percakapan produksi yang sebenarnya.

Batasan

Batasan berikut berlaku:

  • Adaptasi ucapan tidak tersedia untuk semua model ucapan dan kombinasi bahasa. Lihat halaman dukungan bahasa Cloud Speech untuk memverifikasi apakah "adaptasi model" tersedia untuk model ucapan dan kombinasi bahasa Anda.
  • Saat ini, adaptasi ucapan manual belum mendukung class kustom atau tata bahasa ABNF. Anda dapat mengaktifkan adaptasi ucapan otomatis atau menggunakan permintaan intent deteksi runtime untuk memanfaatkan fitur adaptasi ini.

  • Nilai peningkatan yang sama dapat berperforma berbeda untuk model ucapan dan bahasa yang berbeda, jadi berhati-hatilah saat mengonfigurasinya secara manual untuk agen yang menggunakan beberapa bahasa atau model ucapan. Saat ini, adaptasi ucapan manual berlaku untuk semua bahasa dalam agen, sehingga agen multibahasa hanya boleh menggunakan frasa agnostik bahasa atau membagi setiap bahasa menjadi agen terpisah. Karena perilaku pembiasan default (tidak memberikan peningkatan atau peningkatan 0) biasanya berperforma cukup baik untuk semua bahasa dan model, Anda tidak perlu mengonfigurasi nilai peningkatan khusus bahasa, kecuali jika pembiasan yang lebih kuat diperlukan untuk kasus penggunaan pengenalan Anda. Anda dapat mempelajari lebih lanjut cara mengoptimalkan nilai peningkatan dalam panduan Cloud Speech-to-Text ini.

  • Mengenali urutan karakter yang panjang menantang. Jumlah karakter yang ditangkap dalam satu putaran terkait langsung dengan kualitas audio input Anda. Jika Anda telah mengikuti semua pedoman entitas regexp dan mencoba menggunakan token class ucapan yang relevan dalam setelan adaptasi ucapan manual, dan masih kesulitan menangkap seluruh urutan dalam satu kesempatan, Anda dapat mempertimbangkan beberapa alternatif yang lebih komunikatif:
    • Saat memvalidasi urutan terhadap database, sebaiknya lakukan referensi silang parameter lain yang dikumpulkan, seperti tanggal, nama, atau nomor telepon untuk memungkinkan kecocokan yang tidak lengkap. Misalnya, alih-alih hanya meminta nomor pesanan dari pengguna, mintalah nomor telepon mereka juga. Sekarang, saat melakukan kueri database untuk status pesanan, webhook dapat mengandalkan nomor telepon terlebih dahulu, lalu menampilkan urutan yang paling cocok untuk akun tersebut. Hal ini dapat memungkinkan Dialogflow salah mendengar "ABC" sebagai "AVC", tetapi masih menampilkan status pesanan yang benar untuk pengguna.
    • Untuk urutan yang sangat panjang, sebaiknya desain alur yang mendorong pengguna akhir untuk berhenti sejenak di tengah sehingga bot dapat mengonfirmasi saat Anda melanjutkan.