Halaman ini menjelaskan cara mengaktifkan pengenalan bahasa untuk permintaan transkripsi audio yang dikirim ke Speech-to-Text.
Dalam beberapa situasi, Anda tidak tahu secara pasti bahasa apa yang terkandung dalam rekaman audio Anda. Misalnya, jika Anda memublikasikan layanan, aplikasi, atau produk di negara dengan beberapa bahasa resmi, Anda berpotensi menerima input audio dari pengguna dalam berbagai bahasa. Hal ini dapat membuat penentuan satu kode bahasa untuk permintaan transkripsi jauh lebih sulit.
Pengenalan beberapa bahasa
Speech-to-Text menawarkan cara bagi Anda untuk menentukan serangkaian bahasa alternatif yang mungkin berisi data audio. Saat mengirim permintaan transkripsi audio ke Speech-to-Text, Anda dapat memberikan daftar bahasa tambahan yang mungkin disertakan dalam data audio. Jika Anda menyertakan daftar bahasa dalam permintaan, Speech-to-Text akan mencoba mentranskripsikan audio berdasarkan bahasa yang paling sesuai dengan sampel dari alternatif yang Anda berikan. Speech-to-Text kemudian melabeli hasil transkripsi dengan kode bahasa yang diprediksi.
Fitur ini ideal untuk aplikasi yang perlu mentranskripsikan pernyataan singkat seperti perintah suara atau penelusuran. Anda dapat mencantumkan hingga tiga bahasa alternatif dari beragam bahasa yang didukung Speech-to-Text selain bahasa utama Anda (total untuk empat bahasa).
Meskipun Anda dapat menentukan bahasa alternatif untuk permintaan transkripsi
ucapan, Anda tetap harus memberikan kode bahasa utama
di kolom languageCode
. Selain itu, Anda harus membatasi jumlah
bahasa yang Anda minta seminimal mungkin. Semakin sedikit kode bahasa alternatif
yang Anda minta, Speech-to-Text akan lebih
berhasil memilih bahasa yang benar. Menentukan hanya satu bahasa
akan memberikan hasil terbaik.
Aktifkan pengenalan bahasa dalam permintaan transkripsi audio
Untuk menentukan bahasa alternatif dalam transkripsi audio,
Anda harus menetapkan kolom alternativeLanguageCodes
ke daftar
kode bahasa dalam parameter RecognitionConfig
untuk permintaan tersebut singkat ini. Speech-to-Text mendukung
kode bahasa alternatif untuk semua metode pengenalan ucapan:
speech:recognize
.speech:longrunningrecognize
,
dan Streaming.
Menggunakan file lokal
Protocol
Lihat endpoint API speech:recognize
untuk mengetahui detail selengkapnya.
Untuk melakukan pengenalan ucapan sinkron, buat permintaan POST
dan berikan
isi permintaan yang sesuai. Berikut ini contoh permintaan POST
yang menggunakan
curl
. Contoh ini menggunakan Google Cloud CLI untuk membuat token akses. Untuk petunjuk tentang cara menginstal gcloud CLI,
lihat panduan memulai.
Contoh berikut menunjukkan cara meminta transkripsi file audio yang mungkin menyertakan ucapan dalam bahasa Inggris, Prancis, atau Jerman.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Jika permintaan berhasil, server akan menampilkan kode status HTTP 200 OK
dan respons dalam format JSON, yang disimpan ke file bernama multi-language.txt
.
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast I'm ..." "confidence": 0.9466864 } ], "languageCode": "en-us" }, { "alternatives": [ { "transcript": " let's go with the black one", "confidence": 0.9829583 } ], "languageCode": "en-us" }, ] }
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Speech-to-Text, lihat Library klien Speech-to-Text. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Speech-to-Text.
Untuk mengautentikasi ke Speech-to-Text, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Speech-to-Text, lihat Library klien Speech-to-Text. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Node.js Speech-to-Text.
Untuk mengautentikasi ke Speech-to-Text, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Speech-to-Text, lihat Library klien Speech-to-Text. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Speech-to-Text.
Untuk mengautentikasi ke Speech-to-Text, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menggunakan file jarak jauh
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Speech-to-Text, lihat Library klien Speech-to-Text. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Speech-to-Text.
Untuk mengautentikasi ke Speech-to-Text, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Speech-to-Text, lihat Library klien Speech-to-Text. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Node.js Speech-to-Text.
Untuk mengautentikasi ke Speech-to-Text, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Speech-to-Text, lihat Library klien Speech-to-Text. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Speech-to-Text.
Untuk mengautentikasi ke Speech-to-Text, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.