Untuk meningkatkan akurasi dan performa transkripsi serta pengenalan ucapan, Cloud Speech-to-Text V1 API memperbarui model ucapan klasik yang tersisa ke model berbasis Conformer yang canggih dengan cara yang tidak merusak fungsi API. Model klasik merujuk pada model yang ditampilkan di V1 API berdasarkan flag model command_and_search
, default
, phone_call
, dan video
. Game ini didasarkan pada model bahasa dan akustik yang terpisah serta telah mendukung kasus penggunaan Speech-to-Text API yang dipilih.
Sejak awal arsitektur Conformer pada tahun 2020 di Google Brain, kami telah menguji solusi kami dan secara bertahap mengganti model Speech-to-Text V1 API kami. Tindakan ini telah meningkatkan akurasi, keandalan, dan performa dalam domain di berbagai kasus penggunaan. Di halaman ini, Anda dapat menemukan petunjuk tentang cara memanfaatkan migrasi dan cara memilih ikut serta untuk bermigrasi lebih awal atau lebih baru, tergantung kebutuhan Anda.
Yang berubah
Setelah batas waktu migrasi, kami akan mulai mengalihkan traffic dari model yang saat ini diekspos. ID model ini akan tetap valid dan terus menyalurkan traffic, karena pengalihan terjadi secara internal.
Tabel ini menampilkan pemilihan rute yang akan dilakukan saat migrasi dilakukan. Pengalihan akan terjadi di antara ID model yang sudah terlihat. Meskipun tidak wajib, Anda dapat membuat perubahan kode dan menguji perilaku model sesuai waktu Anda sendiri.
Kode BCP-47 | ID model saat ini | single_utterance | Traffic ID model diarahkan ke |
---|---|---|---|
en-US | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
telephony |
|
phone_call |
false |
telephony |
|
phone_call(use_enhanced=true) |
true |
telephony_short |
|
video |
false |
telephony |
|
de-DE, en-AU, en-GB, en-IN, es-ES, es-US, fr-CA, fr-FR, it-IT, ja-JP, nl-NL, pt-BR | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
latest_long |
|
phone_call(use_enhanced=true) |
true |
latest_short |
|
phone_call |
false |
latest_long |
Linimasa
Anda memiliki tiga opsi migrasi, yang diuraikan di halaman ini. Pada Januari 2024, kami mulai mengalihkan traffic secara bertahap dari model klasik ke model berbasis Conformer, yang project demi project, dengan komunikasi individu sebelum migrasi. Pada Juni 2024, kami berencana untuk mengalihkan semua traffic hanya ke model Conformer. Siapa pun yang masih meminta model klasik akan otomatis dialihkan ke model berbasis Conformer yang sesuai.
Mekanisme migrasi
Pelanggan dapat memilih ikut serta lebih awal atau memilih tidak ikut dan bermigrasi nanti dengan mengikuti petunjuk berikut:
Lebih disarankan: Ikut serta dan migrasikan lebih awal
Jika Anda ingin ikut serta secara proaktif, ubah ID model yang telah Anda gunakan di Speech-to-Text V1 API dengan yang sudah diupdate, seperti yang ditunjukkan dalam tabel sebelumnya. Dengan memigrasikan project secara proaktif, Anda memiliki waktu untuk menguji model dan memanfaatkan akurasi dan keandalan yang lebih baik sebelumnya.
Migrasikan secara otomatis
Agar otomatis dimigrasikan, Anda tidak perlu melakukan tindakan apa pun. ID model Speech-to-Text V1 API yang ada valid dan kami mengalihkan traffic secara internal. Anda akan menerima komunikasi dari tim kami saat project Anda dimigrasikan.
Untuk memeriksa status migrasi project Anda:
Buka konsol Ucapan Google Cloud.
Buka bagian "Fitur pratinjau" di menu navigasi di sebelah kiri.
Periksa status model Anda di tabel.
Tidak ikut dan bermigrasi nanti
Untuk memilih tidak ikut untuk sementara dan melakukan migrasi sesuai waktu Anda:
Buka konsol Ucapan Google Cloud.
Buka bagian "Fitur pratinjau" di menu navigasi di sebelah kiri.
Aktifkan tombol untuk memilih tidak ikut model pilihan Anda.
Perlu diketahui bahwa kami akan memigrasikan paksa semua project yang tidak diikutsertakan paling lambat Juni 2024, seperti yang ditunjukkan di linimasa kami.