Model yang lebih sesuai (panjang dan pendek)

Tag model "terbaru" di Speech-to-Text API memberikan akses ke dua tag model baru yang dapat digunakan saat Anda menentukan kolom model. Model ini dirancang untuk memberi Anda akses ke teknologi ucapan dan riset machine learning terbaru dari Google, serta dapat memberikan akurasi yang lebih tinggi untuk pengenalan ucapan dibandingkan model lain yang tersedia. Namun, beberapa fitur yang didukung oleh model lain yang tersedia belum didukung oleh model "terbaru".

Model terbaru didasarkan pada teknologi Conformer Speech Model dari Google. Untuk mengetahui lebih lanjut, lihat Publikasi Riset Google.

Penggunaan model terbaru memerlukan pemahaman umum tentang penggunaan Speech-to-Text API atau UI. Lihat Panduan Memulai kami jika ini pertama kalinya Anda menggunakannya.

ID model

Model terbaru tersedia dalam dua versi berbeda:

Model latest_short adalah model untuk ucapan singkat yang berdurasi beberapa detik. Model ini berguna saat merekam perintah atau kasus penggunaan ucapan terarah satu pengambilan lainnya. Saat Anda menggunakan model ini, layanan akan berhenti mentranskripsi audio setelah ucapan pertama terdeteksi dan selesai.

Pengenalan terpisah per saluran tidak didukung oleh model ini. Walaupun audio multisaluran diterima, hanya saluran pertama yang akan diproses dan ditranskripsikan.
Model latest_long adalah model untuk semua jenis konten berdurasi panjang seperti media atau ucapan dan percakapan spontan.

Teknologi model

Tujuan model terbaru ini adalah menghadirkan teknologi ucapan terbaru langsung kepada pengguna Google Cloud. Model Terbaru kami saat ini didasarkan pada teknologi Conformer Speech Model dari Google, tetapi hal ini dapat berubah di masa mendatang. Untuk mengetahui lebih lanjut, lihat daftar Publikasi Riset Google.

Harga

Model latest_long dan latest_short akan ditagih sebagai "Standar". Untuk mengetahui informasi selengkapnya, lihat Harga.

Pembaruan Model

Model terbaru didasarkan pada teknologi machine learning yang berkembang pesat. Karena itu, kami mungkin lebih sering melakukan update atau pembaruan model daripada model yang lain. Update ini dapat menambahkan fitur tambahan atau membuat sedikit perubahan pada akurasi atau latensi.

Languages

Model terbaru tersedia dalam lebih dari 20 bahasa dan lebih dari 50 varian. Kami terus menambahkan bahasa, jadi lihat Bahasa untuk mengetahui daftar terbaru.

Dukungan dan batasan fitur

Dukungan fitur bervariasi menurut bahasa: Lihat Bahasa untuk mengetahui daftar lengkap fitur yang didukung.

Model terbaru saat ini tidak mendukung fitur berikut:

Skor Keyakinan - API akan menampilkan nilai, tetapi bukan sepenuhnya skor keyakinan.
Diarisasi - Tidak ada model terbaru yang mendukung diarisasi.