Anda dapat menentukan bahwa Speech-to-Text menunjukkan nilai akurasi, atau tingkat keyakinan, untuk setiap kata dalam transkripsi.
Keyakinan tingkat kata
Saat mentranskripsikan klip audio, Speech-to-Text juga mengukur tingkat akurasi respons. Respons yang dikirim dari Speech-to-Text menyatakan tingkat keyakinan untuk seluruh permintaan transkripsi sebagai angka antara 0,0 dan 1,0. Contoh kode berikut menunjukkan nilai tingkat keyakinan yang ditampilkan oleh Speech-to-Text.
{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.96748614 } ] } ] }
Selain tingkat keyakinan seluruh transkripsi, Speech-to-Text juga dapat memberikan tingkat keyakinan setiap kata dalam transkripsi. Respons ini kemudian
menyertakan detail WordInfo
dalam transkripsi, yang menunjukkan tingkat keyakinan untuk setiap kata seperti yang ditunjukkan dalam
contoh berikut.
{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98360395, "words": [ { "startOffset": "0s", "endOffset": "0.300s", "word": "how", "confidence": SOME NUMBER }, ... ] } ] } ] }
Mengaktifkan keyakinan tingkat kata dalam permintaan
Cuplikan kode berikut menunjukkan cara mengaktifkan keyakinan tingkat kata dalam permintaan transkripsi ke Speech-to-Text menggunakan file lokal dan jarak jauh.
Menggunakan file lokal
Protocol
Lihat endpoint API speech:recognize
untuk mengetahui detail selengkapnya.
Untuk melakukan pengenalan ucapan sinkron, buat permintaan POST
dan berikan
isi permintaan yang sesuai. Berikut ini contoh permintaan POST
yang menggunakan
curl
. Contoh ini menggunakan Google Cloud CLI untuk membuat token akses. Untuk petunjuk tentang cara menginstal gcloud CLI,
lihat panduan memulai.
Contoh berikut menunjukkan cara mengirim permintaan POST
menggunakan curl
, di mana isi permintaan mengaktifkan keyakinan tingkat kata.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v2/projects/{project}/locations/global/recognizers/{recognizers}:recognize \ --data '{ "config": { "features": { "enableWordTimeOffsets": true, "enableWordConfidence": true } }, "uri": "gs://cloud-samples-tests/speech/brooklyn.flac" }' > word-level-confidence.txt
Jika permintaan berhasil, server akan menampilkan kode status HTTP 200 OK
dan respons dalam format JSON, yang disimpan ke file bernama word-level-confidence.txt
.
{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98360395, "words": [ { "startTime": "0s", "endTime": "0.300s", "word": "how", "confidence": 0.98762906 }, { "startTime": "0.300s", "endTime": "0.600s", "word": "old", "confidence": 0.96929157 }, { "startTime": "0.600s", "endTime": "0.800s", "word": "is", "confidence": 0.98271006 }, { "startTime": "0.800s", "endTime": "0.900s", "word": "the", "confidence": 0.98271006 }, { "startTime": "0.900s", "endTime": "1.100s", "word": "Brooklyn", "confidence": 0.98762906 }, { "startTime": "1.100s", "endTime": "1.500s", "word": "Bridge", "confidence": 0.98762906 } ] } ], "languageCode": "en-us" } ] }
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Speech-to-Text, lihat Library klien Speech-to-Text. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Speech-to-Text.
Untuk mengautentikasi ke Speech-to-Text, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.