Adaptasi ucapan

Saat melakukan permintaan intent deteksi, Anda dapat secara opsional memberikan phrase_hints untuk memberikan petunjuk ke pengenal ucapan. Petunjuk ini dapat membantu pengenalan dalam status percakapan tertentu.

Adaptasi ucapan otomatis

Fitur adaptasi ucapan otomatis meningkatkan akurasi pengenalan ucapan agen Anda dengan otomatis menggunakan status percakapan untuk meneruskan entitas yang relevan dan frasa pelatihan sebagai petunjuk konteks ucapan untuk semua permintaan deteksi intent. Fitur ini dinonaktifkan secara default.

Mengaktifkan atau menonaktifkan adaptasi ucapan otomatis

Untuk mengaktifkan atau menonaktifkan adaptasi ucapan otomatis:

Konsol

  1. Buka konsol Dialogflow CX.
  2. Pilih project GCP Anda.
  3. Pilih agen Anda.
  4. Klik Setelan Agen.
  5. Klik tab Ucapan dan IVR.
  6. Aktifkan atau nonaktifkan Aktifkan adaptasi ucapan otomatis.
  7. Klik Simpan.

API

Lihat metode get dan patch/update untuk jenis Agent.

Pilih protokol dan versi untuk referensi Agen:

Protokol V3 V3beta1
REST Referensi agen Referensi agen
RPC Antarmuka agen Antarmuka agen
C++ AgentsClient Tidak tersedia
C# AgentsClient Tidak tersedia
Go AgentsClient Tidak tersedia
Java AgentsClient AgentsClient
Node.js AgentsClient AgentsClient
PHP Tidak tersedia Tidak tersedia
Python AgentsClient AgentsClient
Ruby Tidak tersedia Tidak tersedia

Desain agen untuk peningkatan pengenalan ucapan

Dengan mengaktifkan adaptasi ucapan otomatis, Anda dapat membuat agen dengan cara untuk memanfaatkannya. Bagian berikut menjelaskan cara pengenalan ucapan dapat ditingkatkan dengan perubahan tertentu pada frasa pelatihan, dan entitas agen Anda.

Frasa latihan

  • Jika Anda menentukan frasa pelatihan dengan frasa seperti "hidung tersumbat", ucapan pengguna akhir yang terdengar serupa akan dikenali dengan andal sebagai "hidung tersumbat", bukan "hal yang dia ketahui".
  • Jika Anda memiliki parameter yang diperlukan yang memaksa Dialogflow ke perintah mengisi formulir, adaptasi ucapan otomatis akan sangat bias terhadap entitas yang diisi.

Dalam semua kasus, adaptasi ucapan otomatis hanya membiaskan pengenalan ucapan, bukan membatasinya. Misalnya, meskipun Dialogflow meminta parameter yang diperlukan kepada pengguna, pengguna masih dapat memicu intent lain seperti intent "berbicara dengan agen" tingkat atas.

Entity sistem

Jika Anda menentukan frasa pelatihan yang menggunakan entitas sistem @sys.number, dan pengguna akhir mengucapkan "Saya ingin dua", frasa tersebut mungkin dikenali sebagai "to", "too", "2", atau "two".

Dengan mengaktifkan adaptasi ucapan otomatis, Dialogflow menggunakan entity @sys.number sebagai petunjuk selama pengenalan ucapan, dan parameter tersebut lebih cenderung diekstrak sebagai "2".

Entity kustom

  • Jika Anda menentukan entitas kustom untuk nama produk atau layanan yang ditawarkan oleh perusahaan Anda, dan pengguna akhir menyebutkan istilah ini dalam ucapan, istilah tersebut lebih mungkin dikenali. Frasa pelatihan "Saya suka Dialogflow", dengan "Dialogflow" dianotasi sebagai entity @product, akan memberi tahu adaptasi ucapan otomatis untuk memiliki bias terhadap "Saya suka Dialogflow", "Saya suka Cloud Speech", dan semua entri lainnya dalam entity @product.

  • Sangat penting untuk menentukan sinonim entitas yang bersih saat menggunakan Dialogflow untuk mendeteksi ucapan. Bayangkan Anda memiliki dua entri entity @product, "Dialogflow" dan "Dataflow". Sinonim Anda untuk "Dialogflow" mungkin adalah "Dialogflow", "alur dialog", "pembuat dialog", "Speaktoit", "speak to it", "API.ai", "API dot AI". Ini adalah sinonim yang baik karena mencakup variasi yang paling umum. Anda tidak perlu menambahkan "builder alur dialog" karena "alur dialog" sudah mencakupnya.

  • Ucapan pengguna dengan entitas angka berurutan tetapi berbeda dapat bersifat ambigu. Misalnya, "Saya ingin dua paket enam belas" mungkin berarti 2 jumlah paket 16, atau 216 jumlah paket. Adaptasi ucapan dapat membantu membedakan kasus ini jika Anda menyiapkan entity dengan nilai yang dieja:
    • Tentukan entitas quantity dengan entri:
      zero
      one
      ...
      twenty
    • Tentukan entity product atau size dengan entri:
      sixteen pack
      two ounce
      ...
      five liter
    • Hanya sinonim entity yang digunakan dalam adaptasi ucapan, sehingga Anda dapat menentukan entity dengan nilai referensi 1 dan sinonim tunggal one untuk menyederhanakan logika fulfillment.

Entity Regexp

Entitas ekspresi reguler dapat memicu adaptasi ucapan otomatis untuk urutan alfanumerik dan angka seperti "ABC123" atau "12345" saat dikonfigurasi dan diuji dengan benar.

Untuk mengenali urutan ini melalui suara, terapkan keempat persyaratan di bawah:

1. Persyaratan entri Regexp

Meskipun ekspresi reguler apa pun dapat digunakan untuk mengekstrak entitas dari input teks, hanya ekspresi tertentu yang akan memberi tahu adaptasi ucapan otomatis untuk memiringkan urutan alfanumerik atau angka yang dieja saat mengenali ucapan.

Dalam entitas regexp, setidaknya satu entri harus mengikuti semua aturan berikut:

  • Harus cocok dengan beberapa karakter alfanumerik, misalnya: \d, \w, [a-zA-Z0-9]
  • Tidak boleh berisi spasi kosong   atau \s, meskipun \s* dan \s? diizinkan
  • Tidak boleh berisi grup pengambilan atau non-pengambilan ()
  • Sebaiknya jangan mencoba mencocokkan karakter khusus atau tanda baca seperti: ` ~ ! @ # $ % ^ & * ( ) - _ = + , . < > / ? ; ' : " [ ] { } \ |

Entri ini dapat memiliki kumpulan karakter [] dan pengukur pengulangan seperti *, ?, +, {3,5}.

Lihat Contoh.

2. Persyaratan definisi parameter

Tandai entity regexp sebagai parameter formulir yang diperlukan, sehingga dapat dikumpulkan selama pengisian formulir. Hal ini memungkinkan adaptasi ucapan otomatis sangat bias untuk pengenalan urutan, bukan mencoba mengenali intent dan urutan secara bersamaan. Jika tidak, "Where is my package for ABC123" mungkin salah dikenali sebagai "Where is my package 4ABC123".

3. Persyaratan anotasi frasa pelatihan

Jangan gunakan entitas regexp untuk anotasi frasa pelatihan intent. Hal ini memastikan bahwa parameter di-resolve sebagai bagian dari pengisian formulir.

4. Persyaratan pengujian

Lihat Menguji adaptasi ucapan.

Contoh

Misalnya, entitas ekspresi reguler dengan satu entri ([a-zA-Z0-9]\s?){5,9} tidak akan memicu pengenal urutan ucapan karena berisi grup tangkapan. Untuk memperbaikinya, cukup tambahkan entri lain untuk [a-zA-Z0-9]{5,9}. Sekarang Anda akan mendapatkan manfaat dari pengenal urutan saat mencocokkan "ABC123", tetapi NLU akan tetap mencocokkan input seperti "ABC 123" berkat aturan asli yang mengizinkan spasi.

Contoh ekspresi reguler berikut disesuaikan untuk urutan alfanumerik:

^[A-Za-z0-9]{1,10}$
WAC\d+
215[2-8]{3}[A-Z]+
[a-zA-Z]\s?[a-zA-Z]\s?[0-9]\s?[0-9]\s?[0-9]\s?[a-zA-Z]\s?[a-zA-Z]

Contoh ekspresi reguler berikut disesuaikan untuk urutan digit:

\d{2,8}
^[0-9]+$
2[0-9]{7}
[2-9]\d{2}[0-8]{3}\d{4}
Solusi Regexp

Dukungan bawaan adaptasi ucapan otomatis untuk entity regexp bervariasi menurut bahasa. Periksa Token class ucapan untuk bahasa yang didukung $OOV_CLASS_ALPHANUMERIC_SEQUENCE dan $OOV_CLASS_DIGIT_SEQUENCE.

Jika bahasa Anda tidak tercantum, Anda dapat mengatasi batasan ini. Misalnya, jika Anda ingin ID karyawan yang terdiri dari tiga huruf diikuti dengan tiga digit dikenali secara akurat, Anda dapat membuat agen dengan entitas dan parameter berikut:

  • Tentukan entitas digit yang berisi 10 entri entitas (dengan sinonim):
    0, 0
    1, 1
    ...
    9, 9
  • Tentukan entitas letter yang berisi 26 entri entitas (dengan sinonim):
    A, A
    B, B
    ...
    Z, Z
  • Tentukan entity employee-id yang berisi satu entri entity (tanpa sinonim):
    @letter @letter @letter @digit @digit @digit
  • Gunakan @employee-id sebagai parameter dalam frasa pelatihan.

Adaptasi ucapan manual

Adaptasi ucapan manual memungkinkan Anda mengonfigurasi frasa adaptasi ucapan secara manual untuk alur atau halaman. Hal ini juga akan mengganti konteks ucapan implisit yang dihasilkan oleh adaptasi ucapan otomatis saat yang terakhir diaktifkan.

Setelan adaptasi ucapan tingkat alur dan tingkat halaman memiliki hubungan hierarkis, yang berarti bahwa halaman mewarisi setelan adaptasi ucapan dari tingkat alur secara default dan tingkat halaman yang lebih terperinci selalu mengganti tingkat alur jika halaman memiliki setelan yang disesuaikan.

Untuk setelan adaptasi ucapan, setelan tingkat alur, dan setelan tingkat halaman dapat diaktifkan secara terpisah. Jika setelan adaptasi tingkat alur tidak diaktifkan, Anda masih dapat memilih Sesuaikan di tingkat halaman untuk mengaktifkan adaptasi ucapan manual untuk halaman tertentu tersebut. Demikian pula, jika Anda menonaktifkan adaptasi ucapan manual di setelan tingkat alur, halaman dalam alur dengan Sesuaikan yang dipilih tidak akan terpengaruh.

Namun, setelan tingkat alur dan setelan tingkat halaman tidak dapat dinonaktifkan secara terpisah. Jika adaptasi ucapan manual diaktifkan untuk alur, Anda tidak dapat menonaktifkannya untuk halaman di bagian alur melalui pilihan Sesuaikan. Oleh karena itu, jika ingin memiliki penggunaan campuran adaptasi ucapan manual dan adaptasi ucapan otomatis untuk halaman dalam alur, Anda tidak boleh mengaktifkan adaptasi ucapan manual di tingkat alur dan hanya boleh menggunakan setelan adaptasi tingkat halaman. Anda dapat melihat tabel di bawah untuk memahami kombinasi alur dan setelan halaman yang harus digunakan untuk kasus adaptasi Anda.

Efek target Penggunaan setelan adaptasi yang direkomendasikan
Menonaktifkan adaptasi otomatis untuk alur Alur diaktifkan tanpa kumpulan frasa (halaman dalam alur secara default menggunakan setelan alur).
Menonaktifkan adaptasi otomatis untuk halaman Alur dinonaktifkan dan halaman diaktifkan (Customize dipilih) tanpa kumpulan frasa.
Hanya gunakan adaptasi ucapan manual untuk semua halaman dalam alur Alur diaktifkan. Menyesuaikan halaman yang perlu menggunakan kumpulan frasa yang berbeda dari alur.
Campuran penggunaan adaptasi otomatis dan manual dalam alur Alur dinonaktifkan. Sesuaikan halaman yang ingin Anda terapkan adaptasi manual.
Hanya menggunakan adaptasi ucapan otomatis untuk semua halaman dalam alur Alur dinonaktifkan.

Mengaktifkan atau menonaktifkan adaptasi ucapan manual

Untuk mengaktifkan atau menonaktifkan adaptasi ucapan manual di tingkat alur atau halaman:

Setelan Alur

  1. Buka konsol Dialogflow CX.
  2. Pilih project GCP Anda.
  3. Arahkan kursor mouse ke alur di bagian Alur.
  4. Klik tombol opsi .
  5. Pilih Flow Settings di menu dropdown.
  6. Centang kotak Enable manual speech adaptation atau hapus centangnya.
  7. Mengedit, menambahkan, atau menghapus set frasa di tabel set frasa
  8. Klik Simpan.

Setelan Halaman

  1. Buka konsol Dialogflow CX.
  2. Pilih project GCP Anda.
  3. Arahkan kursor ke halaman di bagian Halaman.
  4. Klik tombol opsi .
  5. Pilih Page Settings di menu dropdown.
  6. Gunakan tingkat alur dipilih secara default dan jika dipilih, frasa adaptasi tingkat alur akan digunakan kembali untuk halaman ini. Anda dapat memilih Sesuaikan untuk mengonfigurasi frasa adaptasi yang berbeda dengan setelan tingkat alur. Meskipun adaptasi ucapan manual dinonaktifkan di tingkat alur, Anda tetap dapat mengaktifkan dan mengonfigurasi adaptasi ucapan manual untuk halaman dalam alur tersebut melalui opsi Sesuaikan.
  7. Mengedit, menambahkan, atau menghapus set frasa di tabel set frasa adaptasi
  8. Klik Simpan.

Konfigurasi kumpulan frasa manual untuk peningkatan pengenalan ucapan

1. Kata dan frasa

Dalam kumpulan frasa adaptasi, Anda dapat menentukan frasa satu kata atau beberapa kata dengan referensi opsional ke token class ucapan. Misalnya, Anda dapat menambahkan frasa seperti "tarif bagus", "nomor pelacakan adalah $OOV_CLASS_ALPHANUMERIC_SEQUENCE", atau "$FULLPHONENUM". Frasa yang diberikan ini meningkatkan kemungkinan frasa tersebut ditranskripsikan daripada frasa lain yang mirip secara fonetik. Saat Anda menambahkan frasa yang terdiri dari beberapa kata tanpa penguatan, bias diterapkan ke seluruh frasa dan bagian yang berkelanjutan dalam frasa. Secara umum, jumlah frasa harus dijaga agar tetap kecil dan Anda hanya boleh menambahkan frasa yang sulit dikenali oleh pengenalan ucapan tanpa adaptasi ucapan. Jika Speech-to-Text sudah dapat mengenali frasa dengan benar, Anda tidak perlu menambahkan frasa ini ke setelan adaptasi ucapan. Jika Anda melihat beberapa frasa yang sering salah dikenali oleh Speech-to-Text di halaman atau alur, Anda dapat menambahkan frasa yang benar ke setelan adaptasi yang sesuai.

Contoh koreksi error pengenalan

Berikut adalah contoh cara menggunakan adaptasi ucapan untuk memperbaiki masalah pengenalan. Misalnya, Anda sedang mendesain agen perdagangan perangkat ponsel, dan pengguna dapat mengucapkan sesuatu yang mencakup frasa "jual ponsel" atau "ponsel" setelah agen mengajukan pertanyaan pertamanya "apa yang Anda butuhkan bantuannya?". Lalu, bagaimana kita dapat menggunakan adaptasi ucapan untuk meningkatkan akurasi pengenalan pada kedua frasa tersebut?

Jika Anda menyertakan kedua frasa tersebut dalam setelan adaptasi, Text-to-Speech mungkin masih bingung, karena keduanya terdengar mirip. Jika Anda hanya memberikan satu frasa dari dua frasa tersebut, Speech-to-Text mungkin salah mengenali satu frasa sebagai frasa lainnya. Untuk meningkatkan akurasi pengenalan ucapan untuk kedua frasa tersebut, Anda perlu memberikan lebih banyak petunjuk konteks kepada Speech-to-Text untuk membedakan kapan Speech-to-Text harus mendengar "jual ponsel" dan kapan Speech-to-Text harus mendengar "ponsel". Misalnya, Anda mungkin melihat orang sering menggunakan "jual ponsel" sebagai bagian dari ucapan seperti "cara menjual ponsel", "ingin menjual ponsel", atau "apakah Anda menjual ponsel", sedangkan "ponsel" sebagai bagian dari ucapan seperti "beli ponsel", "tagihan ponsel", dan "layanan ponsel". Jika Anda memberikan frasa yang lebih tepat ini ke model, bukan frasa asli singkat "ponsel" dan "jual ponsel", Speech-to-Text akan mempelajari bahwa "jual ponsel" sebagai frasa kata kerja lebih cenderung mengikuti kata-kata seperti "cara", "ingin", dan "maukah Anda", sedangkan "ponsel" sebagai frasa kata benda lebih cenderung mengikuti kata-kata seperti "beli" atau diikuti oleh kata-kata seperti "tagihan" atau "layanan". Oleh karena itu, sebagai aturan umum untuk mengonfigurasi frasa adaptasi, sebaiknya berikan frasa yang lebih tepat seperti "cara menjual ponsel" atau "apakah Anda menjual ponsel" daripada hanya menyertakan "jual ponsel".

2. Token class ucapan

Selain kata bahasa alami, Anda juga dapat menyematkan referensi ke token class ucapan ke dalam frasa. Token class ucapan mewakili konsep umum yang biasanya mengikuti format tertentu dalam tulisan. Misalnya, untuk nomor alamat dalam alamat seperti "123 Main Street", orang biasanya mengharapkan untuk melihat format angka nomor alamat "123" dalam alamat, bukan versi yang dieja sepenuhnya "seratus dua puluh tiga". Jika Anda mengharapkan format tertentu dalam hasil transkripsi, terutama untuk urutan alfanumerik, lihat daftar token class yang didukung untuk mengetahui token yang tersedia untuk bahasa dan kasus penggunaan Anda.

Jika halaman sudah memiliki rute atau parameter intent dengan referensi ke entity sistem, berikut adalah tabel referensi untuk pemetaan antara entity sistem umum dan token class ucapan:

Entity sistem Token class ucapan
@sys.date $MONTH $DAY $YEAR
@sys.date-time $MONTH $DAY $YEAR
@sys.date-period $MONTH $DAY $YEAR
@sys.time $TIME
@sys.time-period $TIME
@sys.age $OPERAND
@sys.number $OPERAND
@sys.number-integer $OPERAND
@sys.cardinal $OPERAND
@sys.ordinal $OPERAND
@sys.percentage $OPERAND
@sys.duration $OPERAND
@sys.currency-name $MONEY
@sys.unit-currency $MONEY
@sys.phone-number $FULLPHONENUM
@sys.zip-code $POSTALCODE atau $OOV_CLASS_POSTALCODE
@sys.address $ADDRESSNUM $STREET $POSTALCODE
@sys.street-address $ADDRESSNUM $STREET $POSTALCODE
@sys.temperature $OOV_CLASS_TEMPERATURE
@sys.number-sequence $OOV_CLASS_DIGIT_SEQUENCE
@sys.flight-number $OOV_CLASS_ALPHANUMERIC_SEQUENCE

3. Nilai boost

Jika menambahkan frasa tanpa nilai boost tidak memberikan efek bias yang cukup kuat, Anda dapat menggunakan nilai boost untuk lebih memperkuat efek bias adaptasi ucapan.

Penguatan menerapkan bias tambahan saat ditetapkan ke nilai yang lebih besar dari 0 dan tidak lebih dari 20. Jika boost kosong atau 0, efek bias default akan membantu mengenali seluruh frasa dan bagian berkelanjutan dalam frasa. Misalnya, frasa yang tidak dioptimalkan "apakah Anda buka untuk menjual ponsel" membantu mengenali frasa tersebut dan juga frasa serupa seperti "Saya menjual ponsel" dan "Halo apakah Anda buka".

Saat penguatan positif diterapkan, efek biasing akan lebih kuat, tetapi hanya berlaku untuk frasa yang sama persis. Misalnya, frasa yang dioptimalkan "jual ponsel" membantu mengenali "bisakah Anda jual ponsel", tetapi tidak mengenali "apakah Anda menjual ponsel".

Karena alasan ini, Anda akan mendapatkan hasil terbaik jika memberikan frasa dengan dan tanpa pengoptimalan.

Nilai penguatan yang lebih tinggi dapat menghasilkan negatif palsu (NP) yang lebih sedikit, yang merupakan kasus ketika kata atau frasa muncul dalam audio, tetapi tidak dikenali dengan benar oleh Speech-to-Text (underbiasing). Namun, penguatan juga dapat meningkatkan kemungkinan positif palsu (PP); yaitu, kasus saat kata atau frasa muncul dalam transkripsi meskipun tidak muncul dalam audio (overbiasing). Anda biasanya perlu menyesuaikan frasa bias untuk menemukan titik kompromi yang baik antara dua masalah bias.

Anda dapat mempelajari lebih lanjut cara menyesuaikan nilai boost untuk frasa di dokumen Cloud Speech tentang boost.

Kapan harus menggunakan adaptasi ucapan otomatis atau manual

Secara umum, jika Anda tidak yakin apakah adaptasi ucapan akan meningkatkan kualitas pengenalan ucapan untuk agen Anda (tidak ada pola error transkripsi yang jelas), sebaiknya coba adaptasi ucapan otomatis terlebih dahulu sebelum menggunakan adaptasi ucapan manual. Untuk keputusan yang lebih terperinci, pertimbangkan faktor-faktor berikut untuk memutuskan antara adaptasi ucapan otomatis atau adaptasi ucapan manual:

1. Pengisian formulir

Adaptasi ucapan otomatis berfungsi sangat baik dengan pengisian formulir karena menggunakan konteks tata bahasa ABNF untuk parameter formulir dan menerapkan aturan tata bahasa berdasarkan jenis entitas. Karena adaptasi ucapan manual belum mendukung tata bahasa ABNF, Adaptasi Ucapan Otomatis umumnya lebih disukai daripada adaptasi ucapan manual untuk halaman pengisian formulir. Masih untuk halaman yang hanya memiliki parameter entity sistem dan entity regexp sederhana yang didukung oleh token class ucapan, Anda juga dapat menggunakan adaptasi ucapan manual untuk mencapai efek bias yang mirip dengan adaptasi ucapan otomatis tanpa perlu menyesuaikan entity regexp.

2. Kerumitan transisi halaman atau alur

Untuk halaman atau alur sederhana dengan beberapa rute intent, adaptasi ucapan otomatis kemungkinan akan menghasilkan frasa bias perwakilan dan berperforma cukup baik.

Namun, jika halaman atau alur memiliki banyak rute intent (untuk halaman, pertimbangkan juga jumlah rute tingkat alur), atau jika salah satu intent memiliki frasa pelatihan yang terlalu panjang atau pendek dan tidak penting (Misalnya, seluruh kalimat atau satu kata dengan hanya satu atau dua suku kata), kemungkinan besar model adaptasi ucapan tidak akan berfungsi dengan baik dengan frasa ini. Anda harus mencoba menonaktifkan adaptasi ucapan terlebih dahulu untuk halaman terbuka dengan kompleksitas tinggi dengan mengaktifkan adaptasi ucapan manual dengan kumpulan frasa kosong (penggantian adaptasi kosong). Setelah itu, nilai apakah ada frasa khusus yang tidak ambigu yang masih perlu diberikan ke Speech-to-Text untuk meningkatkan kualitas pengenalan.

Gejala lain dari masalah kompleksitas ini adalah melihat berbagai masalah underbiasing atau overbiasing saat adaptasi ucapan otomatis diaktifkan. Serupa dengan kasus di atas, Anda juga perlu menguji dengan penonaktifan adaptasi ucapan untuk halaman tertentu terlebih dahulu. Jika perilaku yang salah tetap ada setelah menonaktifkan adaptasi ucapan, Anda dapat menambahkan frasa yang ingin dikoreksi ke dalam setelan adaptasi ucapan dan bahkan menambahkan nilai peningkatan untuk lebih memperkuat efek bias jika diperlukan.

Menguji adaptasi ucapan

Saat menguji kemampuan adaptasi ucapan agen untuk pencocokan frasa pelatihan atau entity tertentu, Anda tidak boleh langsung menguji pencocokan dengan ucapan suara pertama dari percakapan. Anda hanya boleh menggunakan input suara atau peristiwa untuk seluruh percakapan sebelum pencocokan yang ingin diuji. Perilaku agen Anda saat diuji dengan cara ini akan mirip dengan perilaku dalam percakapan produksi yang sebenarnya.

Batasan

Batasan berikut berlaku:

  • Adaptasi ucapan tidak tersedia untuk semua model ucapan dan kombinasi bahasa. Lihat halaman dukungan bahasa Ucapan Cloud untuk memverifikasi apakah "adaptasi model" tersedia untuk model ucapan dan kombinasi bahasa Anda.
  • Saat ini, adaptasi ucapan manual belum mendukung class kustom atau tata bahasa ABNF. Anda dapat mengaktifkan adaptasi ucapan otomatis atau menggunakan permintaan intent deteksi runtime untuk memanfaatkan fitur adaptasi ini.

  • Nilai peningkatan yang sama dapat berperforma berbeda untuk model ucapan dan bahasa yang berbeda, jadi berhati-hatilah saat mengonfigurasinya secara manual untuk agen yang menggunakan beberapa bahasa atau model ucapan. Saat ini, adaptasi ucapan manual berlaku untuk semua bahasa dalam agen, sehingga agen multibahasa hanya boleh menggunakan frasa yang tidak bergantung pada bahasa atau membagi setiap bahasa menjadi agen terpisah. Karena perilaku bias default (tidak memberikan boost atau boost 0) biasanya berperforma cukup baik untuk semua bahasa dan model, Anda tidak perlu mengonfigurasi nilai boost khusus bahasa kecuali jika bias yang lebih kuat diperlukan untuk kasus penggunaan pengenalan Anda. Anda dapat mempelajari lebih lanjut cara menyetel nilai peningkatan di panduan Cloud Speech-to-Text ini.

  • Mengidentifikasi urutan karakter yang panjang merupakan hal yang sulit. Jumlah karakter yang direkam dalam satu giliran terkait langsung dengan kualitas audio input Anda. Jika Anda telah mengikuti semua panduan entitas ekspresi reguler dan mencoba menggunakan token class ucapan yang relevan dalam setelan adaptasi ucapan manual dan masih kesulitan untuk menangkap seluruh urutan dalam satu giliran, Anda dapat mempertimbangkan beberapa alternatif percakapan lainnya:
    • Saat memvalidasi urutan terhadap database, pertimbangkan untuk melakukan referensi silang terhadap parameter lain yang dikumpulkan seperti tanggal, nama, atau nomor telepon untuk memungkinkan pencocokan yang tidak lengkap. Misalnya, jangan hanya meminta nomor pesanan pengguna, tetapi minta juga nomor teleponnya. Sekarang, saat membuat kueri database untuk status pesanan, webhook dapat mengandalkan nomor telepon terlebih dahulu, lalu menampilkan pesanan yang paling cocok untuk akun tersebut. Hal ini dapat memungkinkan Dialogflow salah mendengar "ABC" sebagai "AVC", tetapi tetap menampilkan status pesanan yang benar untuk pengguna.
    • Untuk urutan yang sangat panjang, pertimbangkan untuk mendesain alur yang mendorong pengguna akhir untuk menjeda di tengah sehingga bot dapat mengonfirmasi saat Anda melanjutkan.