Healthcare Natural Language API adalah bagian dari Cloud Healthcare API yang menggunakan model natural language untuk mengekstrak informasi layanan kesehatan dari teks medis.
Panduan konseptual ini menjelaskan dasar-dasar penggunaan Healthcare Natural Language API, termasuk:
- Jenis permintaan yang dapat Anda buat ke Healthcare Natural Language API
- Cara membuat permintaan ke Healthcare Natural Language API
- Cara menangani respons dari Healthcare Natural Language API
Ringkasan
Healthcare Natural Language API mengekstrak informasi layanan kesehatan dari teks medis. Informasi layanan kesehatan ini dapat mencakup:
- Konsep medis, seperti obat-obatan, prosedur medis, dan kondisi medis
- Fitur fungsional, seperti hubungan sementara, subjek, dan penilaian kepastian
- Hubungan, seperti efek samping dan dosis obat
Memilih antara Healthcare Natural Language API dan AutoML Entity Extraction for Healthcare
Healthcare Natural Language API menawarkan model natural language terlatih untuk mengekstrak konsep dan hubungan medis dari teks medis. Healthcare Natural Language API memetakan teks ke dalam kumpulan kategori pengetahuan medis yang telah ditentukan.
Ekstraksi Entity AutoML untuk Layanan Kesehatan memungkinkan Anda membuat model ekstraksi entity kustom yang dilatih menggunakan teks medis Anda sendiri yang dianotasi dan menggunakan kategori Anda sendiri. Untuk mengetahui informasi selengkapnya, lihat dokumentasi Ekstraksi Entity AutoML untuk Layanan Kesehatan.
Lokasi yang tersedia
Healthcare Natural Language API tersedia di lokasi berikut:
Nama lokasi | Deskripsi lokasi |
---|---|
asia-south1 |
Mumbai, India |
australia-southeast1 |
Sydney, Australia |
europe-west2 |
London, Inggris |
europe-west4 |
Belanda |
northamerica-northeast1 |
Montréal, Kanada |
us-central1 |
Iowa, AS |
Fitur Healthcare Natural Language API
Healthcare Natural Language API memeriksa teks medis untuk menemukan konsep dan
hubungan medis. Anda melakukan analisis entity menggunakan
metode
analyzeEntities
.
Permintaan analisis entity
Healthcare Natural Language API adalah REST API dan terdiri dari permintaan dan respons JSON. Bagian berikut menunjukkan cara mengekstrak wawasan medis yang berbeda dari teks medis tertentu:
- Mengekstrak entity, relasi, dan atribut kontekstual
- Sertakan kosakata berlisensi
- Mengekstrak output sebagai paket FHIR R4
Permintaan analisis entity berisi kolom-kolom berikut:
documentContent
: Data untuk permintaan, yang terdiri dari teks medis. Ukuran maksimum teks medis adalah 20.000 karakter Unicode.licensedVocabularies[]
: Opsional. Kosakata CT SNOMED. Hanya tersedia untuk pengguna di Amerika Serikat.alternativeOutputFormat
: Opsional. Format paket FHIR.
Kolom respons analisis entity
Analisis entity menampilkan serangkaian penyebutan pengetahuan medis yang terdeteksi, konsep medis, dan hubungan antara penyebutan pengetahuan medis, termasuk hal berikut:
entityMentions
: kemunculan entitas pengetahuan medis dalam teks medis sumber. Setiap entitas yang disebutkan memiliki kolom berikut:mentionId
: ID unik untuk entitas yang disebutkan dalam respons.type
: kategori pengetahuan medis yang disebutkan oleh entitas.text
: terdiri dari kolomtextContent
, dan mendeskripsikan kutipan teks medis yang berisi penyebutan entitas, danoffset
, lokasi entitas yang disebutkan dalam teks medis sumber.temporalAssessment
: menentukan cara entitas tertaut berkaitan dengan penyebutan entitas, salah satu dariCURRENT
,CLINICAL_HISTORY
,FAMILY_HISTORY
,UPCOMING
, atauOTHER
.certaintyAssessment
: negasi atau kualifikasi konsep medis, salah satu dariLIKELY
,SOMEWHAT_LIKELY
,UNCERTAIN
,SOMEWHAT_UNLIKELY
,UNLIKELY
, atauCONDITIONAL
.subject
: menentukan subjek yang terkait dengan konsep medis, salah satu dariPATIENT
,FAMILY_MEMBER
, atauOTHER
.linkedEntities
: daftar konsep medis yang mungkin terkait dengan penyebutan entitas ini. Entitas tertaut menentukanentityId
, yang menautkan konsep medis ke entity dientities
.
entities
: menjelaskan konsep medis dari kolom entity tertaut. Setiap entitas dijelaskan menggunakan kolom berikut:entityId
: ID unik dari kolomlinkedEntities
.preferredTerm
: istilah yang disarankan untuk konsep medis.vocabularyCodes
: representasi konsep medis dalam kosa kata medis yang didukung.
relationships
: menentukan hubungan terarah antarsebutan entitas. Dalam sampel, subjek hubungannya adalah "rejimen insulin manusia" dan objek hubungan adalah "5 unit".confidence
: indikasi keyakinan model dalam hubungan sebagai angka antara 0 dan 1.
Selain kolom yang tercantum, respons mungkin juga berisi kolom additionalInfo
, yang menyatakan deskripsi tambahan apa pun tentang jenis penyebutan entity.
Lihat Informasi tambahan.
Bahasa yang didukung
Healthcare Natural Language API hanya mendukung ekstraksi informasi layanan kesehatan dari teks bahasa Inggris.
Kosakata medis yang didukung
Healthcare Natural Language API mendukung kosakata medis berikut:
- Model Dasar Anatomi
- Ontologi Gen
- Komite Nomenklatur Gene HUGO
- Ontologi Fenotipe Manusia
- Sistem Pengkodean Prosedur ICD-10
- ICD-10-CM
- ICD-9-CM
- {i>LOINC<i}
- MeSH
- Topik Kesehatan MedlinePlus
- Nama Metathesaurus
- Taksonomi NCBI
- Tesaurus NCI
- File Obat Nasional
- Pewarisan Mendelian Online dalam Manusia
- RXNORM
- SNOMED CT (hanya tersedia untuk pengguna di AS)
Kategori pengetahuan medis yang didukung
Healthcare Natural Language API menetapkan kategori pengetahuan medis ke kolom entityMentions.type
.
Daftar kategori pengetahuan medis yang didukung adalah sebagai berikut. Entitas menyebutkan jenis yang termasuk dalam kelompok onkologi, faktor penentu kesehatan (SDOH), dan informasi kesehatan terlindungi (PHI) hanya tersedia di Pratinjau:
Grup | Kategori pengetahuan medis | Deskripsi |
---|---|---|
Umum | ANATOMICAL_STRUCTURE
|
Bagian kompleks tubuh manusia, seperti sel, organ, dan sistem. |
BODY_FUNCTION
|
Fungsi yang dilakukan oleh tubuh manusia. | |
BF_RESULT
|
Hasil dari fungsi tubuh. | |
BODY_MEASUREMENT
|
Pengukuran normal tubuh manusia, seperti tanda-tanda vital, yang diperoleh tanpa pengujian atau prosedur yang kompleks menggunakan instrumen dasar, seperti termometer atau stetoskop. | |
BM_RESULT
|
Hasil pengukuran tubuh. | |
BM_UNIT
|
Satuan untuk pengukuran tubuh. | |
BM_VALUE
|
Nilai dari pengukuran tubuh. | |
LABORATORY_DATA
|
Hasil pengujian sampel tubuh. | |
LAB_RESULT
|
Deskripsi kualitatif tentang data laboratorium, seperti "meningkat", "berkurang", "positif", atau "negatif". | |
LAB_VALUE
|
Nilai instance data laboratorium. | |
LAB_UNIT
|
Satuan pengukuran untuk nilai laboratorium. | |
MEDICAL_DEVICE
|
Instrumen fisik atau virtual. | |
MEDICINE
|
Obat atau persiapan lain untuk pengobatan atau pencegahan penyakit. | |
MED_DOSE
|
Dosis obat. | |
MED_DURATION
|
Periode pemberian obat. | |
MED_FORM
|
Karakteristik fisik obat tertentu. | |
MED_FREQUENCY
|
Frekuensi minum obat. | |
MED_ROUTE
|
Suatu lokasi di dalam tubuh tempat obat diberikan. | |
MED_STATUS
|
Status obat yang ada, seperti "lanjutkan", "mulai", "mulai ulang", "hentikan", "beralih", "tingkatkan", dan "turunkan". | |
MED_STRENGTH
|
Jumlah bahan aktif dalam dosis obat. | |
MED_UNIT
|
Satuan ukur untuk bahan aktif dalam obat. | |
MED_TOTALDOSE
|
Jumlah obat yang harus dikonsumsi pada satu waktu. | |
PROBLEM
|
Kondisi medis, termasuk temuan dan penyakit. | |
PROCEDURE
|
Prosedur diagnostik atau pengobatan. | |
PROCEDURE_RESULT
|
Hasil suatu prosedur. | |
PROC_METHOD
|
Metode yang digunakan untuk melakukan prosedur. | |
SEVERITY
|
Tingkat keparahan kondisi medis. | |
SUBSTANCE_ABUSE
|
Deskripsi penyalahgunaan zat psikoaktif. | |
Onkologi (Pratinjau) | CLINICAL_STATUS
|
Status kasus kanker seperti "aktif", "berulang", "relaps", dan "terselesaikan". |
DATE
|
Anotasi tanggal, seperti tanggal diagnosis, tanggal prosedur, atau tanggal pengobatan radiasi. {i>Function<i} ini mengekstrak semua elemen tanggal dan mungkin tidak menyertakan tahun. | |
DIMENSIONS
|
Pengukuran Tumor, massa, atau pertumbuhan yang tidak normal. | |
GENE_STUDIED
|
Gen-gen yang dipelajari secara langsung atau tidak langsung mengarah pada pembentukan kanker, seperti BRCA1, p53, dan ALK. | |
HISTOLOGICAL_GRADE
|
Sistem klasifikasi untuk menilai tampilan sel kanker. | |
LAB_SPECIMEN
|
Bahan biologis yang dikumpulkan dari tubuh untuk pengujian atau pengambilan sampel. | |
RADIATION_DOSAGE
|
Jumlah radiasi yang diberikan kepada pasien. | |
ONSET
|
Anotasi tanggal untuk mewakili tanggal ketika pasien pertama kali mengamati masalah yang terkait dengan kanker. | |
VARIATION_CODE
|
Kode yang diberikan ke varian genom tertentu yang terdeteksi dalam sistem coding utama seperti ClinVar dan HGVS. | |
Determinan sosial kesehatan (SDoH) (Pratinjau) | AGE
|
ID usia. Kategori ini mencakup frasa yang mendeskripsikan usia, seperti "terlihat lebih muda dari usia yang dinyatakan", "paruh tengah", "78 tahun", atau "remaja".
Catatan: HIPAA mengklasifikasikan usia seseorang sebagai PHI hanya jika usia seseorang di atas 90 tahun. Untuk informasi selengkapnya, lihat Ringkasan Aturan Privasi HIPAA. |
FAMILY
|
Frasa yang menggambarkan struktur keluarga atau kerabat pasien, seperti "menikah dengan dua anak", "saudara laki-laki", "istri", "orang tua yang suportif", atau "bercerai". | |
LIVING_SITUATION
|
Frasa yang menggambarkan situasi hidup pasien, seperti "dengan teman sekamar", "memiliki perawat 24/7 di rumah", atau "baru saja pindah". | |
SOCIAL_IDENTITY
|
Frasa yang menggambarkan identitas sosial pasien atau keluarga termasuk ras, etnis, orientasi seksual, agama, kewarganegaraan, bahasa yang diucapkan atau tidak, atau negara asal. | |
PHYSICAL_APPEARANCE
|
Frasa yang menggambarkan ciri fisik pasien atau keluarga yang paling terlihat atau jelas, seperti "bekas luka di pipi kanan", "Sindrom bawah", "obesitas", atau "kaki kiri diamputasi". | |
OCCUPATION
|
Frasa yang menggambarkan pekerjaan dan status pekerjaan pasien atau keluarga, seperti "ibu pensiunan", "bekerja sebagai tukang las selama 20 tahun", atau "berhenti bekerja tahun lalu". | |
Informasi kesehatan terlindungi (PHI) (Pratinjau) | PERSON_NAME
|
ID nama umum untuk seseorang. Menyertakan judul, seperti "Dr.", "Ny.", atau "MD" |
ORGANIZATION_NAME
|
ID untuk organisasi medis yang mengumpulkan PHI, seperti klinik, panti jompo, atau rumah sakit. | |
GENERIC_ID
|
Tanda pengenal umum yang mengidentifikasi rekam medis, pasien, dokter, rumah sakit, seperti SSN pasien, atau nomor penyedia. | |
LOCATION
|
Lokasi geografis yang mungkin berisi nama dan nomor bangunan, jalan, kota, negara bagian, atau kode pos. | |
PHONE_NUMBER
|
Nomor untuk menunjukkan nomor telepon, nomor faks, atau nomor penyeranta. | |
EMAIL_ADDRESS
|
ID alamat email. | |
URL
|
Alamat situs web. | |
ZIPCODE
|
ID kode pos. |
Kategori fitur fungsional yang didukung
Healthcare Natural Language API dapat menyimpulkan fitur atau atribut fungsional
dari entity yang disebutkan dari konteks. Misalnya, dalam pernyataan
"Ibu Kusuma menderita diabetes", kondisi "diabetes" memiliki fitur fungsional
subject
FAMILY_MEMBER
.
Hubungan sementara
Hubungan sementara, yang ditampilkan di kolom temporalAssessment
, menjelaskan
bagaimana penyebutan entitas ini berkaitan dengan subjek untuk sementara.
Healthcare Natural Language API mendukung hubungan sementara berikut:
CURRENT
CLINICAL_HISTORY
FAMILY_HISTORY
UPCOMING
OTHER
Subjek
Subjek, yang ditampilkan di kolom subject
, mendeskripsikan individu yang terkait dengan
entitas.
Healthcare Natural Language API mendukung subjek berikut:
PATIENT
FAMILY_MEMBER
OTHER
Penilaian kepastian
Penilaian kepastian, yang ditampilkan di kolom certaintyAssessment
, menggambarkan keyakinan pembuat catatan awal. Misalnya, jika catatan asli
berisi "Pasien mengalami sakit tenggorokan", penilaian kepastian
akan menampilkan nilai LIKELY
untuk menunjukkan keyakinan pembuat catatan bahwa
ada kemungkinan bahwa pasien mengalami sakit tenggorokan. Jika catatan asli berisi "Pasien tidak
memiliki sakit tenggorokan", penilaian kepastian akan menampilkan nilai UNLIKELY
untuk menunjukkan keyakinan pembuat catatan bahwa tidak mungkin
pasien mengalami sakit tenggorokan.
Penilaian kepastian dapat berupa salah satu nilai berikut:
LIKELY
SOMEWHAT_LIKELY
UNCERTAIN
SOMEWHAT_UNLIKELY
UNLIKELY
CONDITIONAL
Informasi tambahan
Kolom additionalInfo
memberikan detail tambahan tentang sebutan
entity. Misalnya, kolom additionalInfo
untuk penyebutan entity DATE
mungkin
terdiri dari detail tentang jenis tanggal, yang dikategorikan sebagai salah satu dari hal berikut:
ADMISSION_DATE
CONSULTATION_DATE
DISCHARGE_DATE
SERVICE_DATE
VISIT_DATE
DIAGNOSIS_DATE
MED_STARTED_DATE
MED_ENDED_DATE
NOTE_DATE
PROCEDURE_DATE
RADIATION_STARTED_DATE
RADIATION_ENDED_DATE
STAGE_DATE
Hubungan yang didukung antara penyebutan entitas
Healthcare Natural Language API dapat menyimpulkan hubungan antara sebutan
entity berdasarkan teks medis di sekitarnya. Dalam respons, subjek
hubungan diidentifikasi oleh subjectId
dan objek
hubungan diidentifikasi oleh objectId
.
Healthcare Natural Language API mendukung hubungan berikut antara penyebutan entity:
Subjek | Objek |
---|---|
ANATOMICAL_STRUCTURE |
MEDICAL_DEVICE |
BODY_FUNCTION |
BF_RESULT |
BODY_MEASUREMENT |
BM_RESULT |
BODY_MEASUREMENT |
BM_UNIT |
BODY_MEASUREMENT |
BM_VALUE |
LABORATORY_DATA |
LAB_RESULT |
LABORATORY_DATA |
LAB_UNIT |
LABORATORY_DATA |
LAB_VALUE |
MEDICINE |
MED_DOSE |
MEDICINE |
MED_DURATION |
MEDICINE |
MED_FORM |
MEDICINE |
MED_FREQUENCY |
MEDICINE |
MED_ROUTE |
MEDICINE |
MED_STATUS |
MEDICINE |
MED_STRENGTH |
MEDICINE |
MED_TOTALDOSE |
MEDICINE |
MED_UNIT |
PROBLEM |
ANATOMICAL_STRUCTURE |
PROBLEM |
MEDICINE |
PROBLEM |
PROCEDURE |
PROBLEM |
SEVERITY |
PROCEDURE |
ANATOMICAL_STRUCTURE |
PROCEDURE |
PROC_METHOD |
PROCEDURE |
PROCEDURE_RESULT |
SUBSTANCE_ABUSE |
SEVERITY |
Output Healthcare Natural Language API sebagai paket FHIR
Saat Anda meminta metode analyzeEntities
dengan kolom
alternativeOutputFormat
ditetapkan ke FHIR_BUNDLE
, responsnya akan mencakup objek JSON berikut:
- Entity menyebutkan, entity, dan relasi
- Paket FHIR R4 direpresentasikan sebagai string, yang mencakup semua entity, penyebutan entity, dan hubungan dalam format JSON
Untuk membuat paket FHIR R4, Healthcare Natural Language API memetakan sebutan, entity, dan hubungan entity ke resource FHIR dan elemennya. Tabel berikut mencantumkan beberapa pemetaan ini.
Penyebutan entitas Healthcare Natural Language API | Kategori Pengetahuan Medis | Resource dan elemen FHIR R4 |
---|---|---|
PROBLEM |
Condition |
|
PROBLEM |
Condition.category |
|
PROBLEM |
Condition.status |
|
PROBLEM |
ANATOMICAL_STRUCTURE |
Condition.bodySite |
PROBLEM |
ANATOMICAL_STRUCTURE |
Condition.evidence |
PROBLEM |
SEVERITY |
Condition.severity |
PROCEDURE |
Procedure |
|
PROCEDURE |
Procedure.status |
|
PROCEDURE |
Procedure.code |
|
PROCEDURE |
ANATOMICAL_STRUCTURE |
Procedure.bodySite |
PROCEDURE |
MEDICAL_DEVICE |
Procedure.usedCode |
PROCEDURE |
PROBLEM |
Procedure.reasonReference |
MEDICINE |
MedicationStatement |
|
MEDICINE |
MedicationStatement.status |
|
MEDICINE |
MedicationStatement.medication |
|
MEDICINE |
PROBLEM |
MedicationStatement.reasonReference |
MEDICINE |
MED_DOSE |
MedicationStatement.dosage.doseAndRate.doseQuantity |
MEDICINE |
MED_FREQUENCY |
MedicationStatement.dosage.text |
MEDICINE |
MED_ROUTE |
MedicationStatement.dosage.route |
MEDICINE |
MED_STRENGTH |
MedicationStatement.dosage.doseAndRate.doseQuantity |
MEDICINE |
MED_UNIT |
MedicationStatement.dosage.doseAndRate.doseQuantity |
Untuk mengekstrak entity dari teks sebagai paket FHIR R4, lihat Mengekstrak output sebagai paket FHIR R4.