Healthcare Natural Language API

Healthcare Natural Language API adalah bagian dari Cloud Healthcare API yang menggunakan model natural language untuk mengekstrak informasi layanan kesehatan dari teks medis.

Panduan konseptual ini menjelaskan dasar-dasar penggunaan Healthcare Natural Language API, termasuk:

  • Jenis permintaan yang dapat Anda buat ke Healthcare Natural Language API
  • Cara membuat permintaan ke Healthcare Natural Language API
  • Cara menangani respons dari Healthcare Natural Language API

Ringkasan

Healthcare Natural Language API mengekstrak informasi layanan kesehatan dari teks medis. Informasi layanan kesehatan ini dapat mencakup:

  • Konsep medis, seperti obat-obatan, prosedur medis, dan kondisi medis
  • Fitur fungsional, seperti hubungan sementara, subjek, dan penilaian kepastian
  • Hubungan, seperti efek samping dan dosis obat

Memilih antara Healthcare Natural Language API dan AutoML Entity Extraction for Healthcare

Healthcare Natural Language API menawarkan model natural language terlatih untuk mengekstrak konsep dan hubungan medis dari teks medis. Healthcare Natural Language API memetakan teks ke dalam kumpulan kategori pengetahuan medis yang telah ditentukan.

Ekstraksi Entity AutoML untuk Layanan Kesehatan memungkinkan Anda membuat model ekstraksi entity kustom yang dilatih menggunakan teks medis Anda sendiri yang dianotasi dan menggunakan kategori Anda sendiri. Untuk mengetahui informasi selengkapnya, lihat dokumentasi Ekstraksi Entity AutoML untuk Layanan Kesehatan.

Lokasi yang tersedia

Healthcare Natural Language API tersedia di lokasi berikut:

Nama lokasi Deskripsi lokasi
asia-south1 Mumbai, India
australia-southeast1 Sydney, Australia
europe-west2 London, Inggris
europe-west4 Belanda
northamerica-northeast1 Montréal, Kanada
us-central1 Iowa, AS

Fitur Healthcare Natural Language API

Healthcare Natural Language API memeriksa teks medis untuk menemukan konsep dan hubungan medis. Anda melakukan analisis entity menggunakan metode analyzeEntities.

Permintaan analisis entity

Healthcare Natural Language API adalah REST API dan terdiri dari permintaan dan respons JSON. Bagian berikut menunjukkan cara mengekstrak wawasan medis yang berbeda dari teks medis tertentu:

Permintaan analisis entity berisi kolom-kolom berikut:

Kolom respons analisis entity

Analisis entity menampilkan serangkaian penyebutan pengetahuan medis yang terdeteksi, konsep medis, dan hubungan antara penyebutan pengetahuan medis, termasuk hal berikut:

  • entityMentions: kemunculan entitas pengetahuan medis dalam teks medis sumber. Setiap entitas yang disebutkan memiliki kolom berikut:

    • mentionId: ID unik untuk entitas yang disebutkan dalam respons.
    • type: kategori pengetahuan medis yang disebutkan oleh entitas.
    • text: terdiri dari kolom textContent, dan mendeskripsikan kutipan teks medis yang berisi penyebutan entitas, dan offset, lokasi entitas yang disebutkan dalam teks medis sumber.
    • temporalAssessment: menentukan cara entitas tertaut berkaitan dengan penyebutan entitas, salah satu dari CURRENT, CLINICAL_HISTORY, FAMILY_HISTORY, UPCOMING, atau OTHER.
    • certaintyAssessment: negasi atau kualifikasi konsep medis, salah satu dari LIKELY, SOMEWHAT_LIKELY, UNCERTAIN, SOMEWHAT_UNLIKELY, UNLIKELY, atau CONDITIONAL.
    • subject: menentukan subjek yang terkait dengan konsep medis, salah satu dari PATIENT, FAMILY_MEMBER, atau OTHER.
    • linkedEntities: daftar konsep medis yang mungkin terkait dengan penyebutan entitas ini. Entitas tertaut menentukan entityId, yang menautkan konsep medis ke entity di entities.
  • entities: menjelaskan konsep medis dari kolom entity tertaut. Setiap entitas dijelaskan menggunakan kolom berikut:

    • entityId: ID unik dari kolom linkedEntities.
    • preferredTerm: istilah yang disarankan untuk konsep medis.
    • vocabularyCodes: representasi konsep medis dalam kosa kata medis yang didukung.
  • relationships: menentukan hubungan terarah antarsebutan entitas. Dalam sampel, subjek hubungannya adalah "rejimen insulin manusia" dan objek hubungan adalah "5 unit".

  • confidence: indikasi keyakinan model dalam hubungan sebagai angka antara 0 dan 1.

Selain kolom yang tercantum, respons mungkin juga berisi kolom additionalInfo, yang menyatakan deskripsi tambahan apa pun tentang jenis penyebutan entity. Lihat Informasi tambahan.

Bahasa yang didukung

Healthcare Natural Language API hanya mendukung ekstraksi informasi layanan kesehatan dari teks bahasa Inggris.

Kosakata medis yang didukung

Healthcare Natural Language API mendukung kosakata medis berikut:

  • Model Dasar Anatomi
  • Ontologi Gen
  • Komite Nomenklatur Gene HUGO
  • Ontologi Fenotipe Manusia
  • Sistem Pengkodean Prosedur ICD-10
  • ICD-10-CM
  • ICD-9-CM
  • {i>LOINC<i}
  • MeSH
  • Topik Kesehatan MedlinePlus
  • Nama Metathesaurus
  • Taksonomi NCBI
  • Tesaurus NCI
  • File Obat Nasional
  • Pewarisan Mendelian Online dalam Manusia
  • RXNORM
  • SNOMED CT (hanya tersedia untuk pengguna di AS)

Kategori pengetahuan medis yang didukung

Healthcare Natural Language API menetapkan kategori pengetahuan medis ke kolom entityMentions.type. Daftar kategori pengetahuan medis yang didukung adalah sebagai berikut. Entitas menyebutkan jenis yang termasuk dalam kelompok onkologi, faktor penentu kesehatan (SDOH), dan informasi kesehatan terlindungi (PHI) hanya tersedia di Pratinjau:

Grup Kategori pengetahuan medis Deskripsi
Umum ANATOMICAL_STRUCTURE Bagian kompleks tubuh manusia, seperti sel, organ, dan sistem.
BODY_FUNCTION Fungsi yang dilakukan oleh tubuh manusia.
BF_RESULT Hasil dari fungsi tubuh.
BODY_MEASUREMENT Pengukuran normal tubuh manusia, seperti tanda-tanda vital, yang diperoleh tanpa pengujian atau prosedur yang kompleks menggunakan instrumen dasar, seperti termometer atau stetoskop.
BM_RESULT Hasil pengukuran tubuh.
BM_UNIT Satuan untuk pengukuran tubuh.
BM_VALUE Nilai dari pengukuran tubuh.
LABORATORY_DATA Hasil pengujian sampel tubuh.
LAB_RESULT Deskripsi kualitatif tentang data laboratorium, seperti "meningkat", "berkurang", "positif", atau "negatif".
LAB_VALUE Nilai instance data laboratorium.
LAB_UNIT Satuan pengukuran untuk nilai laboratorium.
MEDICAL_DEVICE Instrumen fisik atau virtual.
MEDICINE Obat atau persiapan lain untuk pengobatan atau pencegahan penyakit.
MED_DOSE Dosis obat.
MED_DURATION Periode pemberian obat.
MED_FORM Karakteristik fisik obat tertentu.
MED_FREQUENCY Frekuensi minum obat.
MED_ROUTE Suatu lokasi di dalam tubuh tempat obat diberikan.
MED_STATUS Status obat yang ada, seperti "lanjutkan", "mulai", "mulai ulang", "hentikan", "beralih", "tingkatkan", dan "turunkan".
MED_STRENGTH Jumlah bahan aktif dalam dosis obat.
MED_UNIT Satuan ukur untuk bahan aktif dalam obat.
MED_TOTALDOSE Jumlah obat yang harus dikonsumsi pada satu waktu.
PROBLEM Kondisi medis, termasuk temuan dan penyakit.
PROCEDURE Prosedur diagnostik atau pengobatan.
PROCEDURE_RESULT Hasil suatu prosedur.
PROC_METHOD Metode yang digunakan untuk melakukan prosedur.
SEVERITY Tingkat keparahan kondisi medis.
SUBSTANCE_ABUSE Deskripsi penyalahgunaan zat psikoaktif.
Onkologi (Pratinjau) CLINICAL_STATUS Status kasus kanker seperti "aktif", "berulang", "relaps", dan "terselesaikan".
DATE Anotasi tanggal, seperti tanggal diagnosis, tanggal prosedur, atau tanggal pengobatan radiasi. {i>Function<i} ini mengekstrak semua elemen tanggal dan mungkin tidak menyertakan tahun.
DIMENSIONS Pengukuran Tumor, massa, atau pertumbuhan yang tidak normal.
GENE_STUDIED Gen-gen yang dipelajari secara langsung atau tidak langsung mengarah pada pembentukan kanker, seperti BRCA1, p53, dan ALK.
HISTOLOGICAL_GRADE Sistem klasifikasi untuk menilai tampilan sel kanker.
LAB_SPECIMEN Bahan biologis yang dikumpulkan dari tubuh untuk pengujian atau pengambilan sampel.
RADIATION_DOSAGE Jumlah radiasi yang diberikan kepada pasien.
ONSET Anotasi tanggal untuk mewakili tanggal ketika pasien pertama kali mengamati masalah yang terkait dengan kanker.
VARIATION_CODE Kode yang diberikan ke varian genom tertentu yang terdeteksi dalam sistem coding utama seperti ClinVar dan HGVS.
Determinan sosial kesehatan (SDoH) (Pratinjau) AGE ID usia. Kategori ini mencakup frasa yang mendeskripsikan usia, seperti "terlihat lebih muda dari usia yang dinyatakan", "paruh tengah", "78 tahun", atau "remaja".

Catatan: HIPAA mengklasifikasikan usia seseorang sebagai PHI hanya jika usia seseorang di atas 90 tahun. Untuk informasi selengkapnya, lihat Ringkasan Aturan Privasi HIPAA.

FAMILY Frasa yang menggambarkan struktur keluarga atau kerabat pasien, seperti "menikah dengan dua anak", "saudara laki-laki", "istri", "orang tua yang suportif", atau "bercerai".
LIVING_SITUATION Frasa yang menggambarkan situasi hidup pasien, seperti "dengan teman sekamar", "memiliki perawat 24/7 di rumah", atau "baru saja pindah".
SOCIAL_IDENTITY Frasa yang menggambarkan identitas sosial pasien atau keluarga termasuk ras, etnis, orientasi seksual, agama, kewarganegaraan, bahasa yang diucapkan atau tidak, atau negara asal.
PHYSICAL_APPEARANCE Frasa yang menggambarkan ciri fisik pasien atau keluarga yang paling terlihat atau jelas, seperti "bekas luka di pipi kanan", "Sindrom bawah", "obesitas", atau "kaki kiri diamputasi".
OCCUPATION Frasa yang menggambarkan pekerjaan dan status pekerjaan pasien atau keluarga, seperti "ibu pensiunan", "bekerja sebagai tukang las selama 20 tahun", atau "berhenti bekerja tahun lalu".
Informasi kesehatan terlindungi (PHI) (Pratinjau) PERSON_NAME ID nama umum untuk seseorang. Menyertakan judul, seperti "Dr.", "Ny.", atau "MD"
ORGANIZATION_NAME ID untuk organisasi medis yang mengumpulkan PHI, seperti klinik, panti jompo, atau rumah sakit.
GENERIC_ID Tanda pengenal umum yang mengidentifikasi rekam medis, pasien, dokter, rumah sakit, seperti SSN pasien, atau nomor penyedia.
LOCATION Lokasi geografis yang mungkin berisi nama dan nomor bangunan, jalan, kota, negara bagian, atau kode pos.
PHONE_NUMBER Nomor untuk menunjukkan nomor telepon, nomor faks, atau nomor penyeranta.
EMAIL_ADDRESS ID alamat email.
URL Alamat situs web.
ZIPCODE ID kode pos.

Kategori fitur fungsional yang didukung

Healthcare Natural Language API dapat menyimpulkan fitur atau atribut fungsional dari entity yang disebutkan dari konteks. Misalnya, dalam pernyataan "Ibu Kusuma menderita diabetes", kondisi "diabetes" memiliki fitur fungsional subject FAMILY_MEMBER.

Hubungan sementara

Hubungan sementara, yang ditampilkan di kolom temporalAssessment, menjelaskan bagaimana penyebutan entitas ini berkaitan dengan subjek untuk sementara.

Healthcare Natural Language API mendukung hubungan sementara berikut:

  • CURRENT
  • CLINICAL_HISTORY
  • FAMILY_HISTORY
  • UPCOMING
  • OTHER

Subjek

Subjek, yang ditampilkan di kolom subject, mendeskripsikan individu yang terkait dengan entitas.

Healthcare Natural Language API mendukung subjek berikut:

  • PATIENT
  • FAMILY_MEMBER
  • OTHER

Penilaian kepastian

Penilaian kepastian, yang ditampilkan di kolom certaintyAssessment, menggambarkan keyakinan pembuat catatan awal. Misalnya, jika catatan asli berisi "Pasien mengalami sakit tenggorokan", penilaian kepastian akan menampilkan nilai LIKELY untuk menunjukkan keyakinan pembuat catatan bahwa ada kemungkinan bahwa pasien mengalami sakit tenggorokan. Jika catatan asli berisi "Pasien tidak memiliki sakit tenggorokan", penilaian kepastian akan menampilkan nilai UNLIKELY untuk menunjukkan keyakinan pembuat catatan bahwa tidak mungkin pasien mengalami sakit tenggorokan.

Penilaian kepastian dapat berupa salah satu nilai berikut:

  • LIKELY
  • SOMEWHAT_LIKELY
  • UNCERTAIN
  • SOMEWHAT_UNLIKELY
  • UNLIKELY
  • CONDITIONAL

Informasi tambahan

Kolom additionalInfo memberikan detail tambahan tentang sebutan entity. Misalnya, kolom additionalInfo untuk penyebutan entity DATE mungkin terdiri dari detail tentang jenis tanggal, yang dikategorikan sebagai salah satu dari hal berikut:

  • ADMISSION_DATE
  • CONSULTATION_DATE
  • DISCHARGE_DATE
  • SERVICE_DATE
  • VISIT_DATE
  • DIAGNOSIS_DATE
  • MED_STARTED_DATE
  • MED_ENDED_DATE
  • NOTE_DATE
  • PROCEDURE_DATE
  • RADIATION_STARTED_DATE
  • RADIATION_ENDED_DATE
  • STAGE_DATE

Hubungan yang didukung antara penyebutan entitas

Healthcare Natural Language API dapat menyimpulkan hubungan antara sebutan entity berdasarkan teks medis di sekitarnya. Dalam respons, subjek hubungan diidentifikasi oleh subjectId dan objek hubungan diidentifikasi oleh objectId.

Healthcare Natural Language API mendukung hubungan berikut antara penyebutan entity:

Subjek Objek
ANATOMICAL_STRUCTURE MEDICAL_DEVICE
BODY_FUNCTION BF_RESULT
BODY_MEASUREMENT BM_RESULT
BODY_MEASUREMENT BM_UNIT
BODY_MEASUREMENT BM_VALUE
LABORATORY_DATA LAB_RESULT
LABORATORY_DATA LAB_UNIT
LABORATORY_DATA LAB_VALUE
MEDICINE MED_DOSE
MEDICINE MED_DURATION
MEDICINE MED_FORM
MEDICINE MED_FREQUENCY
MEDICINE MED_ROUTE
MEDICINE MED_STATUS
MEDICINE MED_STRENGTH
MEDICINE MED_TOTALDOSE
MEDICINE MED_UNIT
PROBLEM ANATOMICAL_STRUCTURE
PROBLEM MEDICINE
PROBLEM PROCEDURE
PROBLEM SEVERITY
PROCEDURE ANATOMICAL_STRUCTURE
PROCEDURE PROC_METHOD
PROCEDURE PROCEDURE_RESULT
SUBSTANCE_ABUSE SEVERITY

Output Healthcare Natural Language API sebagai paket FHIR

Saat Anda meminta metode analyzeEntities dengan kolom alternativeOutputFormat ditetapkan ke FHIR_BUNDLE, responsnya akan mencakup objek JSON berikut:

  • Entity menyebutkan, entity, dan relasi
  • Paket FHIR R4 direpresentasikan sebagai string, yang mencakup semua entity, penyebutan entity, dan hubungan dalam format JSON

Untuk membuat paket FHIR R4, Healthcare Natural Language API memetakan sebutan, entity, dan hubungan entity ke resource FHIR dan elemennya. Tabel berikut mencantumkan beberapa pemetaan ini.

Penyebutan entitas Healthcare Natural Language API Kategori Pengetahuan Medis Resource dan elemen FHIR R4
PROBLEM Condition
PROBLEM Condition.category
PROBLEM Condition.status
PROBLEM ANATOMICAL_STRUCTURE Condition.bodySite
PROBLEM ANATOMICAL_STRUCTURE Condition.evidence
PROBLEM SEVERITY Condition.severity
PROCEDURE Procedure
PROCEDURE Procedure.status
PROCEDURE Procedure.code
PROCEDURE ANATOMICAL_STRUCTURE Procedure.bodySite
PROCEDURE MEDICAL_DEVICE Procedure.usedCode
PROCEDURE PROBLEM Procedure.reasonReference
MEDICINE MedicationStatement
MEDICINE MedicationStatement.status
MEDICINE MedicationStatement.medication
MEDICINE PROBLEM MedicationStatement.reasonReference
MEDICINE MED_DOSE MedicationStatement.dosage.doseAndRate.doseQuantity
MEDICINE MED_FREQUENCY MedicationStatement.dosage.text
MEDICINE MED_ROUTE MedicationStatement.dosage.route
MEDICINE MED_STRENGTH MedicationStatement.dosage.doseAndRate.doseQuantity
MEDICINE MED_UNIT MedicationStatement.dosage.doseAndRate.doseQuantity

Untuk mengekstrak entity dari teks sebagai paket FHIR R4, lihat Mengekstrak output sebagai paket FHIR R4.