Tag model "terbaru" di Speech-to-Text API memberikan akses ke dua tag model baru yang dapat digunakan saat Anda menentukan kolom model. Model ini dirancang untuk memberi Anda akses ke teknologi ucapan dan riset machine learning terbaru dari Google, serta dapat memberikan akurasi yang lebih tinggi untuk pengenalan ucapan dibandingkan model lain yang tersedia. Namun, beberapa fitur yang didukung oleh model lain yang tersedia belum didukung oleh model "terbaru".
Model terbaru didasarkan pada teknologi Conformer Speech Model dari Google. Untuk mengetahui lebih lanjut, lihat Publikasi Riset Google.
Penggunaan model terbaru memerlukan pemahaman umum tentang penggunaan Speech-to-Text API atau UI. Lihat Panduan Memulai kami jika ini pertama kalinya Anda menggunakannya.
ID model
Model terbaru tersedia dalam dua versi berbeda:
Model
latest_short
adalah model untuk ucapan singkat yang berdurasi beberapa detik. Model ini berguna saat merekam perintah atau kasus penggunaan ucapan terarah satu pengambilan lainnya. Saat Anda menggunakan model ini, layanan akan berhenti mentranskripsi audio setelah ucapan pertama terdeteksi dan selesai.Pengenalan terpisah per saluran tidak didukung oleh model ini. Walaupun audio multisaluran diterima, hanya saluran pertama yang akan diproses dan ditranskripsikan.
Model
latest_long
adalah model untuk semua jenis konten berdurasi panjang seperti media atau ucapan dan percakapan spontan.
Teknologi model
Tujuan model terbaru ini adalah menghadirkan teknologi ucapan terbaru langsung kepada pengguna Google Cloud. Model Terbaru kami saat ini didasarkan pada teknologi Conformer Speech Model dari Google, tetapi hal ini dapat berubah di masa mendatang. Untuk mengetahui lebih lanjut, lihat daftar Publikasi Riset Google.
Harga
Model latest_long
dan latest_short
akan ditagih sebagai "Standar".
Untuk mengetahui informasi selengkapnya, lihat Harga.
Pembaruan Model
Model terbaru didasarkan pada teknologi machine learning yang berkembang pesat. Karena itu, kami mungkin lebih sering melakukan update atau pembaruan model daripada model yang lain. Update ini dapat menambahkan fitur tambahan atau membuat sedikit perubahan pada akurasi atau latensi.
Languages
Model terbaru tersedia dalam lebih dari 20 bahasa dan lebih dari 50 varian. Kami terus menambahkan bahasa, jadi lihat Bahasa untuk mengetahui daftar terbaru.
Dukungan dan batasan fitur
Dukungan fitur bervariasi menurut bahasa: Lihat Bahasa untuk mengetahui daftar lengkap fitur yang didukung.
Model terbaru saat ini tidak mendukung fitur berikut:
Skor Keyakinan - API akan menampilkan nilai, tetapi bukan sepenuhnya skor keyakinan.
Diarisasi - Tidak ada model terbaru yang mendukung diarisasi.