Bermigrasi dari model klasik ke model Conformer

Untuk meningkatkan akurasi dan performa transkripsi serta pengenalan ucapan, Cloud Speech-to-Text V1 API memperbarui model ucapan klasik yang tersisa ke model berbasis Conformer yang canggih dengan cara yang tidak merusak fungsi API. Model klasik merujuk pada model yang ditampilkan di V1 API berdasarkan flag model command_and_search, default, phone_call, dan video. Game ini didasarkan pada model bahasa dan akustik yang terpisah serta telah mendukung kasus penggunaan Speech-to-Text API yang dipilih.

Sejak awal arsitektur Conformer pada tahun 2020 di Google Brain, kami telah menguji solusi kami dan secara bertahap mengganti model Speech-to-Text V1 API kami. Tindakan ini telah meningkatkan akurasi, keandalan, dan performa dalam domain di berbagai kasus penggunaan. Di halaman ini, Anda dapat menemukan petunjuk tentang cara memanfaatkan migrasi dan cara memilih ikut serta untuk bermigrasi lebih awal atau lebih baru, tergantung kebutuhan Anda.

Yang berubah

Setelah batas waktu migrasi, kami akan mulai mengalihkan traffic dari model yang saat ini diekspos. ID model ini akan tetap valid dan terus menyalurkan traffic, karena pengalihan terjadi secara internal.

Tabel ini menampilkan pemilihan rute yang akan dilakukan saat migrasi dilakukan. Pengalihan akan terjadi di antara ID model yang sudah terlihat. Meskipun tidak wajib, Anda dapat membuat perubahan kode dan menguji perilaku model sesuai waktu Anda sendiri.

Kode BCP-47 ID model saat ini single_utterance Traffic ID model diarahkan ke
en-US command_and_search false latest_long
command_and_search true latest_short
default false telephony
phone_call false telephony
phone_call(use_enhanced=true) true telephony_short
video false telephony
de-DE, en-AU, en-GB, en-IN, es-ES, es-US, fr-CA, fr-FR, it-IT, ja-JP, nl-NL, pt-BR command_and_search false latest_long
command_and_search true latest_short
default false latest_long
phone_call(use_enhanced=true) true latest_short
phone_call false latest_long

Linimasa

Anda memiliki tiga opsi migrasi, yang diuraikan di halaman ini. Pada Januari 2024, kami mulai mengalihkan traffic secara bertahap dari model klasik ke model berbasis Conformer, yang project demi project, dengan komunikasi individu sebelum migrasi. Pada Juni 2024, kami berencana untuk mengalihkan semua traffic hanya ke model Conformer. Siapa pun yang masih meminta model klasik akan otomatis dialihkan ke model berbasis Conformer yang sesuai.

Mekanisme migrasi

Pelanggan dapat memilih ikut serta lebih awal atau memilih tidak ikut dan bermigrasi nanti dengan mengikuti petunjuk berikut:

Lebih disarankan: Ikut serta dan migrasikan lebih awal

Jika Anda ingin ikut serta secara proaktif, ubah ID model yang telah Anda gunakan di Speech-to-Text V1 API dengan yang sudah diupdate, seperti yang ditunjukkan dalam tabel sebelumnya. Dengan memigrasikan project secara proaktif, Anda memiliki waktu untuk menguji model dan memanfaatkan akurasi dan keandalan yang lebih baik sebelumnya.

Migrasikan secara otomatis

Agar otomatis dimigrasikan, Anda tidak perlu melakukan tindakan apa pun. ID model Speech-to-Text V1 API yang ada valid dan kami mengalihkan traffic secara internal. Anda akan menerima komunikasi dari tim kami saat project Anda dimigrasikan.

Untuk memeriksa status migrasi project Anda:

  1. Buka konsol Ucapan Google Cloud.

  2. Buka bagian "Fitur pratinjau" di menu navigasi di sebelah kiri.

  3. Periksa status model Anda di tabel.

Tidak ikut dan bermigrasi nanti

Untuk memilih tidak ikut untuk sementara dan melakukan migrasi sesuai waktu Anda:

  1. Buka konsol Ucapan Google Cloud.

  2. Buka bagian "Fitur pratinjau" di menu navigasi di sebelah kiri.

  3. Aktifkan tombol untuk memilih tidak ikut model pilihan Anda.

Perlu diketahui bahwa kami akan memigrasikan paksa semua project yang tidak diikutsertakan paling lambat Juni 2024, seperti yang ditunjukkan di linimasa kami.