Pengantar Model Terbaru

Tag model "terbaru" di Speech-to-Text API memberikan akses ke dua tag model baru yang dapat digunakan saat Anda menentukan kolom model. Model ini dirancang untuk memberi Anda akses ke teknologi ucapan dan riset machine learning terbaru dari Google, serta dapat memberikan akurasi yang lebih tinggi untuk pengenalan ucapan dibandingkan model lain yang tersedia. Namun, beberapa fitur yang didukung oleh model lain yang tersedia belum didukung oleh model "terbaru".

Model terbaru didasarkan pada teknologi Conformer Speech Model dari Google. Untuk mengetahui lebih lanjut, lihat Publikasi Riset Google.

Penggunaan model terbaru memerlukan pemahaman umum tentang penggunaan Speech-to-Text API atau UI. Lihat Panduan Memulai kami jika ini pertama kalinya Anda menggunakannya.

ID model

Model terbaru tersedia dalam dua versi berbeda:

  • Model latest_short adalah model untuk ucapan singkat yang berdurasi beberapa detik. Model ini berguna saat merekam perintah atau kasus penggunaan ucapan terarah satu pengambilan lainnya. Sebaiknya gunakan latest_short, bukan model command_and_search.

  • Model latest_long adalah model untuk semua jenis konten berdurasi panjang seperti media atau ucapan dan percakapan spontan. Sebaiknya gunakan latest_long sebagai pengganti video, terutama jika video tidak tersedia dalam target bahasa Anda. Anda juga dapat menggunakan latest_long sebagai pengganti model default.

Teknologi Model

Tujuan model terbaru ini adalah menghadirkan teknologi ucapan terbaru langsung kepada pengguna Google Cloud. Model Terbaru kami saat ini didasarkan pada teknologi Conformer Speech Model dari Google, tetapi hal ini dapat berubah di masa mendatang. Untuk mengetahui lebih lanjut, lihat daftar Publikasi Riset Google.

Harga

Model latest_long dan latest_short akan ditagihkan sebagai "Standar" dan tunduk pada penggunaan dan biaya yang sama dengan model command_and_search atau default. Untuk mengetahui informasi selengkapnya, lihat Harga.

Pembaruan Model

Model terbaru didasarkan pada teknologi machine learning yang berkembang pesat. Karena itu, kami mungkin lebih sering melakukan update atau pembaruan model daripada model yang lain. Update ini dapat menambahkan fitur tambahan atau membuat sedikit perubahan pada akurasi atau latensi.

Languages

Model terbaru tersedia dalam lebih dari 20 bahasa dan lebih dari 50 varian. Kami terus menambahkan bahasa, jadi lihat Bahasa untuk mengetahui daftar terbaru.

Dukungan dan Batasan Fitur

Dukungan fitur bervariasi menurut bahasa: Lihat Bahasa untuk mengetahui daftar lengkap fitur yang didukung.

Model terbaru saat ini tidak mendukung fitur berikut:

  • Skor Keyakinan - API akan menampilkan nilai, tetapi bukan sepenuhnya skor keyakinan.

Perjanjian Tingkat Layanan Model

Model Terbaru dianggap sebagai bagian yang Tersedia secara Umum dari Speech-to-Text API. Dengan demikian, fungsi yang didukungnya tersedia di API v1 dan memenuhi syarat untuk Perjanjian Tingkat Layanan yang sama serta perlindungan lain yang diberikan untuk produk dan fitur yang Tersedia secara Umum.