Ringkasan
Speech-to-Text Di Perangkat mengaktifkan teknologi ucapan berkualitas server di perangkat yang disematkan. Fitur ini memungkinkan Anda menjalankan pengenalan ucapan streaming sepenuhnya di perangkat, tanpa koneksi ke jaringan atau server Google. Solusi di perangkat menawarkan beberapa keunggulan untuk kasus penggunaan ini jika dibandingkan dengan solusi sisi server: Pengenalan ucapan tersedia meskipun perangkat tidak terhubung ke jaringan atau koneksi jaringan terbatas, dan data pengguna tidak meninggalkan perangkat.
Kapabilitas utama | |
---|---|
Transkripsi berkualitas tinggi | Terapkan algoritma Google ke pengenalan ucapan otomatis. |
Offline | Pengenalan Ucapan tanpa koneksi internet. |
Latensi Rendah | Pengenalan Ucapan berjalan cepat secara lokal di perangkat. |
Model yang efisien | Deploy secara efisien dengan model yang berukuran kurang dari 1 GB dan menggunakan resource minimal. |
Deteksi Aktivitas Suara | Mendeteksi awal dan akhir ucapan manusia. |
Keyakinan | Dapatkan estimasi keyakinan transkripsi. |
Adaptasi model | Tingkatkan akurasi transkripsi kata atau frasa yang jarang digunakan dan khusus domain. |
Langkah selanjutnya
Speech-to-Text di perangkat disajikan dalam dua ragam: sebagai library dan server gRPC.
- libgspeech adalah antarmuka library ke Google Speech. libgspeech memberikan kontrol tambahan atas penggunaan memori dan grafik inferensi yang mendukung Google Speech.
- server ucapan adalah antarmuka server gRPC ke Google Speech. Server cocok untuk pengguna yang familier dengan Cloud Speech API.
Hubungi Google untuk mendapatkan akses.