Mengenali ucapan dengan menggunakan model medis

Speech-to-Text menawarkan dua model medis selain model pengenalan ucapan standar dan ditingkatkan lainnya. Model medis secara khusus disesuaikan untuk pengenalan kata-kata yang umum dalam lingkungan medis, seperti diagnosis, pengobatan, gejala, perawatan, dan kondisi. Jika Anda ingin mengenali jenis data audio ini, Anda dapat meningkatkan hasil transkripsi dengan menggunakan model ini.

Ada dua model medis, masing-masing disesuaikan dengan kasus penggunaan tertentu:

  • medical_conversation: untuk percakapan antara penyedia perawatan medis—misalnya, dokter atau perawat—dan pasien. Gunakan model ini saat penyedia perawatan medis dan pasien sedang berbicara. Kata-kata yang diucapkan oleh setiap pembicara akan otomatis dideteksi dan diberi label dalam transkripsi yang ditampilkan.
  • medical_dictation: untuk catatan dikte yang diucapkan oleh satu penyedia perawatan medis—misalnya, dokter yang mendikte catatan tentang hasil tes darah pasien.

Gunakan model medis hanya dengan fitur Speech-to-Text berikut. Fitur yang dihilangkan dari daftar ini tidak dapat digunakan dengan model medis mana pun.

Model medical conversation mendukung fitur berikut:

dan mengharuskan fitur berikut diaktifkan:

Model medical dictation mendukung fitur berikut:

dan mengharuskan fitur berikut diaktifkan:

Mengirim permintaan transkripsi

REST

Contoh kode berikut menggunakan model medical_conversation untuk mentranskripsikan file audio di bucket Cloud Storage publik.

Sebelum menggunakan data permintaan apa pun, lakukan penggantian sebagai berikut:

  • LANGUAGE_CODE: kode BCP-47 dari bahasa yang diucapkan dalam klip audio Anda. Model medis hanya tersedia untuk en-US.
  • ENCODING: encoding audio yang ingin Anda transkripsikan. Jika Anda menggunakan contoh audio publik, encoding-nya adalah LINEAR16.
  • PROJECT_ID: ID alfanumerik project Google Cloud Anda.

Metode HTTP dan URL:

POST https://speech.googleapis.com/v1/speech:recognize

Meminta isi JSON:

{
  "config": {
    "languageCode": "LANGUAGE_CODE",
    "encoding": "ENCODING",
    "model": "medical_conversation"
  },
  "audio": {
    "uri": "gs://cloud-samples-data/speech/medical_conversation_2.wav"
  }
}

Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:

Anda akan menerima respons JSON yang mirip dengan yang berikut ini:

  "results": [
    {
      "alternatives": [
        {
          "transcript": "Um-hum . Yeah. Hello , good morning . Good
          morning . So , tell me what's going on . Uh , sure , so , um , I
          woke up probably three or four days ago , which , uh , wheezing and short of breath .
          Okay , any cough or chest pain ? I cough infrequently , but no ,
          uh , chest pain . Have you been exposed to anyone with covid ?
          Uh , no , and I also took a test , which was negative . Uh , is it getting
          worse , or better ? Uh , it has been getting a lot worse"
        }
      ]
    },
    {
      "alternatives": [
        {
          "transcript": "Okay . Was there something that triggered this exposure to cold , for
          example ? Um , I had a gone hiking , and I got caught in the rain the day
          before this all started ."
        }
      ]
    }
  ]
}

Tanda baca lisan

Model medical dictation mendukung tanda baca lisan untuk catatan medis. Fitur ini selalu diaktifkan. Tanda baca lisan ditunjukkan dengan tanda kurung siku dalam transkripsi ucapan. Misalnya, transkripsi yang ditampilkan mungkin terlihat seperti berikut:

Patient could be showing signs of trauma [question mark] They said they were [quote] having elevated heart rate [unquote].

Speech-to-Text mendukung tanda baca lisan berikut:

  • titik
  • koma
  • titik dua
  • huruf kapital
  • garis miring
  • tanda pisah
  • tanda hubung
  • tanda tanya
  • titik koma
  • tanda petik
  • tanda petik tutup
  • tanda kutip akhir
  • kurung buka
  • kurung tutup
  • kurung akhir

Perintah pemformatan

Model medical dictation mendukung perintah lisan untuk memformat catatan. Fitur ini selalu diaktifkan. Perintah lisan ditunjukkan dengan tanda kurung siku dalam transkripsi ucapan. Misalnya, transkripsi yang ditampilkan mungkin terlihat seperti berikut:

[next line] Patient says they are experiencing fever [next point].

Speech-to-Text mendukung perintah lisan berikut:

  • poin berikutnya
  • nomor berikutnya
  • paragraf berikutnya
  • huruf kapital
  • kapitalisasi
  • baris baru
  • item berikutnya
  • soal berikutnya
  • nomor soal berikutnya
  • baris berikutnya
  • bagian berikutnya
  • nomor berikutnya
  • ulangi
  • ulangi dari awal
  • akhiri dikte

Judul lisan

Model dikte medis mendukung judul lisan untuk catatan yang didiktekan. Fitur ini diaktifkan secara default, dan tidak dapat dinonaktifkan. Judul akan ditandai dengan tanda kurung dalam transkripsi dan akan menggunakan huruf besar. Misalnya, transkripsi yang ditampilkan mungkin terlihat seperti berikut:

[CURRENT MEDICATIONS] Patient is currently taking no medications.

Speech-to-Text mendukung judul lisan berikut:

  • CHIEF COMPLAINT
  • CURRENT MEDICATIONS
  • DISCHARGE MEDICATIONS
  • DISCHARGE PLAN
  • FAMILY HISTORY
  • FINDINGS
  • REVIEW OF SYSTEMS
  • HISTORY OF PRESENT ILLNESS
  • INDICATIONS
  • LABS
  • PAST SURGICAL HISTORY
  • PHYSICAL EXAM
  • REVIEW OF SYSTEMS
  • RADIOLOGY