Halaman ini diterjemahkan oleh Cloud Translation API.

Mengenali ucapan dengan menggunakan model medis

Speech-to-Text menawarkan dua model medis selain model pengenalan ucapan standar dan ditingkatkan lainnya. Model medis secara khusus disesuaikan untuk pengenalan kata-kata yang umum dalam lingkungan medis, seperti diagnosis, pengobatan, gejala, perawatan, dan kondisi. Jika Anda ingin mengenali jenis data audio ini, Anda dapat meningkatkan hasil transkripsi dengan menggunakan model ini.

Ada dua model medis, masing-masing disesuaikan dengan kasus penggunaan tertentu:

medical_conversation: untuk percakapan antara penyedia perawatan medis—misalnya, dokter atau perawat—dan pasien. Gunakan model ini saat penyedia perawatan medis dan pasien sedang berbicara. Kata-kata yang diucapkan oleh setiap pembicara akan otomatis dideteksi dan diberi label dalam transkripsi yang ditampilkan.
medical_dictation: untuk catatan dikte yang diucapkan oleh satu penyedia perawatan medis—misalnya, dokter yang mendikte catatan tentang hasil tes darah pasien.

Gunakan model medis hanya dengan fitur Speech-to-Text berikut. Fitur yang dihilangkan dari daftar ini tidak dapat digunakan dengan model medis mana pun.

Model medical conversation mendukung fitur berikut:

dan memerlukan pengaktifan fitur berikut:

Tanda baca otomatis

Model medical dictation mendukung fitur berikut:

dan memerlukan pengaktifan fitur berikut:

Mengirim permintaan transkripsi

REST

Contoh kode berikut menggunakan model medical_conversation untuk mentranskripsikan file audio di bucket Cloud Storage publik.

Sebelum menggunakan data permintaan apa pun, lakukan penggantian sebagai berikut:

LANGUAGE_CODE: kode BCP-47 dari bahasa yang diucapkan dalam klip audio Anda. Model medis hanya tersedia untuk en-US.
ENCODING: encoding audio yang ingin Anda transkripsikan. Jika Anda menggunakan contoh audio publik, encoding-nya adalah LINEAR16.
PROJECT_ID: ID alfanumerik untuk project Google Cloud Anda.

Metode HTTP dan URL:

POST https://speech.googleapis.com/v1/speech:recognize

Meminta isi JSON:

{
  "config": {
    "languageCode": "LANGUAGE_CODE",
    "encoding": "ENCODING",
    "model": "medical_conversation"
  },
  "audio": {
    "uri": "gs://cloud-samples-data/speech/medical_conversation_2.wav"
  }
}

Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:

curl (Linux, macOS, atau Cloud Shell)

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke gcloud CLI dengan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login , atau dengan menggunakan Cloud Shell, yang secara otomatis membuat Anda login ke gcloud CLI . Anda dapat memeriksa akun yang saat ini aktif dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://speech.googleapis.com/v1/speech:recognize"

PowerShell (Windows)

Catatan: Perintah berikut mengasumsikan bahwa Anda telah login ke gcloud CLI dengan akun pengguna Anda dengan menjalankan gcloud init atau gcloud auth login . Anda dapat memeriksa akun yang saat ini aktif dengan menjalankan gcloud auth list.

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://speech.googleapis.com/v1/speech:recognize" | Select-Object -Expand Content

Anda akan menerima respons JSON yang mirip dengan yang berikut ini:

  "results": [
    {
      "alternatives": [
        {
          "transcript": "Um-hum . Yeah. Hello , good morning . Good
          morning . So , tell me what's going on . Uh , sure , so , um , I
          woke up probably three or four days ago , which , uh , wheezing and short of breath .
          Okay , any cough or chest pain ? I cough infrequently , but no ,
          uh , chest pain . Have you been exposed to anyone with covid ?
          Uh , no , and I also took a test , which was negative . Uh , is it getting
          worse , or better ? Uh , it has been getting a lot worse"
        }
      ]
    },
    {
      "alternatives": [
        {
          "transcript": "Okay . Was there something that triggered this exposure to cold , for
          example ? Um , I had a gone hiking , and I got caught in the rain the day
          before this all started ."
        }
      ]
    }
  ]
}

Tanda baca lisan

Model medical dictation mendukung tanda baca lisan untuk catatan medis. Fitur ini selalu diaktifkan. Tanda baca lisan ditunjukkan dengan tanda kurung siku dalam transkripsi ucapan. Misalnya, transkripsi yang ditampilkan mungkin terlihat seperti berikut:

Patient could be showing signs of trauma [question mark] They said they were [quote] having elevated heart rate [unquote].

Speech-to-Text mendukung tanda baca lisan berikut:

titik
koma
titik dua
huruf kapital
garis miring
tanda pisah
tanda hubung
tanda tanya
titik koma
tanda petik
tanda petik tutup
tanda kutip akhir
kurung buka
kurung tutup
kurung akhir

Perintah pemformatan

Model medical dictation mendukung perintah lisan untuk memformat catatan. Fitur ini selalu diaktifkan. Perintah lisan ditunjukkan dengan tanda kurung siku dalam transkripsi ucapan. Misalnya, transkripsi yang ditampilkan mungkin terlihat seperti berikut:

[next line] Patient says they are experiencing fever [next point].

Speech-to-Text mendukung perintah lisan berikut:

poin berikutnya
nomor berikutnya
paragraf berikutnya
huruf kapital
kapitalisasi
baris baru
item berikutnya
soal berikutnya
nomor soal berikutnya
baris berikutnya
bagian berikutnya
nomor berikutnya
ulangi
ulangi dari awal
akhiri dikte

Judul lisan

Model dikte medis mendukung judul lisan untuk catatan yang didiktekan. Fitur ini diaktifkan secara default, dan tidak dapat dinonaktifkan. Judul akan ditandai dengan tanda kurung dalam transkripsi dan akan menggunakan huruf besar. Misalnya, transkripsi yang ditampilkan mungkin terlihat seperti berikut:

[CURRENT MEDICATIONS] Patient is currently taking no medications.

Speech-to-Text mendukung judul lisan berikut:

CHIEF COMPLAINT
CURRENT MEDICATIONS
DISCHARGE MEDICATIONS
DISCHARGE PLAN
FAMILY HISTORY
FINDINGS
REVIEW OF SYSTEMS
HISTORY OF PRESENT ILLNESS
INDICATIONS
LABS
PAST SURGICAL HISTORY
PHYSICAL EXAM
REVIEW OF SYSTEMS
RADIOLOGY