Untuk meningkatkan akurasi dan performa transkripsi serta pengenalan ucapan, Cloud Speech-to-Text V1 API memperbarui model ucapan klasik yang tersisa ke model Berbasis konformer canggih dengan cara yang tidak merusak fungsi API. Model klasik mengacu pada model yang ditampilkan di V1 API dalam tanda model command_and_search
, default
, phone_call
, dan video
. Model ini didasarkan pada model bahasa dan akustik terpisah dan telah mendukung kasus penggunaan Speech-to-Text API yang dipilih.
Sejak awal arsitektur Conformer pada tahun 2020 di Google Brain, kami telah menguji solusi kami dan secara bertahap mengganti model Speech-to-Text V1 API kami. Tindakan ini telah meningkatkan akurasi, keandalan, dan performa dalam domain di berbagai kasus penggunaan. Di halaman ini, Anda dapat menemukan petunjuk tentang cara mendapatkan manfaat dari migrasi dan cara memilih untuk bermigrasi lebih awal atau lebih lambat, bergantung pada kebutuhan Anda.
Yang berubah
Setelah batas waktu migrasi, kami akan mulai merutekan traffic dari model yang saat ini ditampilkan. ID model ini akan tetap valid dan terus menayangkan traffic, karena pengalihan terjadi secara internal.
Tabel ini menunjukkan pemilihan rute yang akan dilakukan saat migrasi diterapkan. Pengalihan akan terjadi di antara ID model yang sudah terlihat. Meskipun tidak diwajibkan, Anda dapat melakukan perubahan kode dan menguji perilaku model sesuai waktu Anda sendiri.
Kode BCP-47 | ID model saat ini | single_utterance | Tujuan traffic ID model |
---|---|---|---|
en-US | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
telephony |
|
phone_call |
false |
telephony |
|
phone_call(use_enhanced=true) |
true |
telephony_short |
|
video |
false |
telephony |
|
de-DE, en-AU, en-GB, en-IN, es-ES, es-US, fr-CA, fr-FR, it-IT, ja-JP, nl-NL, pt-BR | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
latest_long |
|
phone_call(use_enhanced=true) |
true |
latest_short |
|
phone_call |
false |
latest_long |
Linimasa
Anda memiliki tiga opsi migrasi, yang diuraikan di halaman ini. Pada Januari 2024, kami akan mulai secara bertahap mengalihkan traffic dari model klasik ke model berbasis Conformer untuk setiap project, dengan komunikasi individual sebelum migrasi. Pada Juni 2024, kami berharap dapat mengalihkan semua traffic hanya ke model Konformis. Siapa pun yang masih meminta model klasik akan otomatis dialihkan ke model berbasis Conformer yang sesuai.
Mekanisme migrasi
Pelanggan dapat memilih untuk ikut serta lebih awal atau memilih tidak ikut serta dan bermigrasi nanti dengan mengikuti petunjuk berikut:
Direkomendasikan: Memilih ikut serta dan melakukan migrasi lebih awal
Jika Anda ingin ikut serta secara proaktif, ubah ID model yang telah Anda gunakan di Speech-to-Text V1 API dengan ID yang diperbarui, seperti yang ditunjukkan dalam tabel sebelumnya. Memigrasikan project secara proaktif memberi Anda waktu untuk menguji model dan memanfaatkan akurasi dan keandalan yang lebih baik lebih awal.
Memilih tidak ikut serta dan bermigrasi nanti
Jika Anda menemukan masalah pada model yang diperbarui dan ingin memilih untuk tidak ikut migrasi untuk sementara, buat Google Cloud kasus dukungan. Saat membuat kasus dukungan, gunakan judul "Memilih tidak ikut migrasi konformer Speech-to-Text" dan berikan Project ID Anda serta alasan untuk memilih tidak ikut.