Tag model "terbaru" di Speech-to-Text API memberikan akses ke dua tag model baru yang dapat digunakan saat Anda menentukan kolom model. Model ini dirancang untuk memberi Anda akses ke teknologi ucapan dan riset machine learning terbaru dari Google, serta dapat memberikan akurasi yang lebih tinggi untuk pengenalan ucapan dibandingkan model lain yang tersedia. Namun, beberapa fitur yang didukung oleh model lain yang tersedia belum didukung oleh model "terbaru".
Model terbaru didasarkan pada teknologi Conformer Speech Model dari Google. Untuk mengetahui lebih lanjut, lihat Publikasi Riset Google.
Penggunaan model terbaru memerlukan pemahaman umum tentang penggunaan Speech-to-Text API atau UI. Lihat Panduan Memulai kami jika ini pertama kalinya Anda menggunakannya.
ID model
Model terbaru tersedia dalam dua versi berbeda:
Model
latest_short
adalah model untuk ucapan singkat yang berdurasi beberapa detik. Model ini berguna saat merekam perintah atau kasus penggunaan ucapan terarah satu pengambilan lainnya. Sebaiknya gunakanlatest_short
, bukan modelcommand_and_search
.Model
latest_long
adalah model untuk semua jenis konten berdurasi panjang seperti media atau ucapan dan percakapan spontan. Sebaiknya gunakanlatest_long
sebagai penggantivideo
, terutama jikavideo
tidak tersedia dalam target bahasa Anda. Anda juga dapat menggunakanlatest_long
sebagai pengganti modeldefault
.
Teknologi Model
Tujuan model terbaru ini adalah menghadirkan teknologi ucapan terbaru langsung kepada pengguna Google Cloud. Model Terbaru kami saat ini didasarkan pada teknologi Conformer Speech Model dari Google, tetapi hal ini dapat berubah di masa mendatang. Untuk mengetahui lebih lanjut, lihat daftar Publikasi Riset Google.
Harga
Model latest_long
dan latest_short
akan ditagihkan sebagai "Standar" dan tunduk pada penggunaan dan biaya yang sama dengan model command_and_search
atau default
. Untuk mengetahui informasi selengkapnya, lihat Harga.
Pembaruan Model
Model terbaru didasarkan pada teknologi machine learning yang berkembang pesat. Karena itu, kami mungkin lebih sering melakukan update atau pembaruan model daripada model yang lain. Update ini dapat menambahkan fitur tambahan atau membuat sedikit perubahan pada akurasi atau latensi.
Languages
Model terbaru tersedia dalam lebih dari 20 bahasa dan lebih dari 50 varian. Kami terus menambahkan bahasa, jadi lihat Bahasa untuk mengetahui daftar terbaru.
Dukungan dan Batasan Fitur
Dukungan fitur bervariasi menurut bahasa: Lihat Bahasa untuk mengetahui daftar lengkap fitur yang didukung.
Model terbaru saat ini tidak mendukung fitur berikut:
- Skor Keyakinan - API akan menampilkan nilai, tetapi bukan sepenuhnya skor keyakinan.
Perjanjian Tingkat Layanan Model
Model Terbaru dianggap sebagai bagian yang Tersedia secara Umum dari Speech-to-Text API. Dengan demikian, fungsi yang didukungnya tersedia di API v1 dan memenuhi syarat untuk Perjanjian Tingkat Layanan yang sama serta perlindungan lain yang diberikan untuk produk dan fitur yang Tersedia secara Umum.