Bermigrasi dari model klasik ke model Conformer

Untuk meningkatkan akurasi dan performa transkripsi serta pengenalan ucapan, Cloud Speech-to-Text V1 API memperbarui model ucapan klasik yang tersisa ke model Berbasis konformer canggih dengan cara yang tidak merusak fungsi API. Model klasik mengacu pada model yang ditampilkan di V1 API dalam tanda model command_and_search, default, phone_call, dan video. Model ini didasarkan pada model bahasa dan akustik terpisah dan telah mendukung kasus penggunaan Speech-to-Text API yang dipilih.

Sejak awal arsitektur Conformer pada tahun 2020 di Google Brain, kami telah menguji solusi kami dan secara bertahap mengganti model Speech-to-Text V1 API kami. Tindakan ini telah meningkatkan akurasi, keandalan, dan performa dalam domain di berbagai kasus penggunaan. Di halaman ini, Anda dapat menemukan petunjuk tentang cara mendapatkan manfaat dari migrasi dan cara memilih untuk bermigrasi lebih awal atau lebih lambat, bergantung pada kebutuhan Anda.

Yang berubah

Setelah batas waktu migrasi, kami akan mulai merutekan traffic dari model yang saat ini ditampilkan. ID model ini akan tetap valid dan terus menayangkan traffic, karena pengalihan terjadi secara internal.

Tabel ini menunjukkan pemilihan rute yang akan dilakukan saat migrasi diterapkan. Pengalihan akan terjadi di antara ID model yang sudah terlihat. Meskipun tidak diwajibkan, Anda dapat melakukan perubahan kode dan menguji perilaku model sesuai waktu Anda sendiri.

Kode BCP-47 ID model saat ini single_utterance Tujuan traffic ID model
en-US command_and_search false latest_long
command_and_search true latest_short
default false telephony
phone_call false telephony
phone_call(use_enhanced=true) true telephony_short
video false telephony
de-DE, en-AU, en-GB, en-IN, es-ES, es-US, fr-CA, fr-FR, it-IT, ja-JP, nl-NL, pt-BR command_and_search false latest_long
command_and_search true latest_short
default false latest_long
phone_call(use_enhanced=true) true latest_short
phone_call false latest_long

Linimasa

Anda memiliki tiga opsi migrasi, yang diuraikan di halaman ini. Pada Januari 2024, kami akan mulai secara bertahap mengalihkan traffic dari model klasik ke model berbasis Conformer untuk setiap project, dengan komunikasi individual sebelum migrasi. Pada Juni 2024, kami berharap dapat mengalihkan semua traffic hanya ke model Konformis. Siapa pun yang masih meminta model klasik akan otomatis dialihkan ke model berbasis Conformer yang sesuai.

Mekanisme migrasi

Pelanggan dapat memilih untuk ikut serta lebih awal atau memilih tidak ikut serta dan bermigrasi nanti dengan mengikuti petunjuk berikut:

Direkomendasikan: Memilih ikut serta dan melakukan migrasi lebih awal

Jika Anda ingin ikut serta secara proaktif, ubah ID model yang telah Anda gunakan di Speech-to-Text V1 API dengan ID yang diperbarui, seperti yang ditunjukkan dalam tabel sebelumnya. Memigrasikan project secara proaktif memberi Anda waktu untuk menguji model dan memanfaatkan akurasi dan keandalan yang lebih baik lebih awal.

Memilih tidak ikut serta dan bermigrasi nanti

Jika Anda menemukan masalah pada model yang diperbarui dan ingin memilih untuk tidak ikut migrasi untuk sementara, buat Google Cloud kasus dukungan. Saat membuat kasus dukungan, gunakan judul "Memilih tidak ikut migrasi konformer Speech-to-Text" dan berikan Project ID Anda serta alasan untuk memilih tidak ikut.