API Healthcare Natural Language

L'API Healthcare Natural Language fait partie de l'API Cloud Healthcare qui utilise des modèles de langage naturel pour extraire des informations médicales d'un texte.

Ce guide conceptuel explique les principes de base de l'utilisation de l'API Healthcare Natural Language, y compris :

Les types de requêtes que vous pouvez envoyer à l'API Healthcare Natural Language
Comment créer des requêtes à l'API Healthcare Natural Language
Comment traiter les réponses de l'API Healthcare Natural Language

Présentation

L'API Healthcare Natural Language extrait des informations de santé à partir de texte médical. Ces informations de santé peuvent inclure les éléments suivants :

Des concepts médicaux, tels que des médicaments, des procédures et des maladies
Des caractéristiques fonctionnelles, telles que les relations temporelles, les sujets et les évaluations de certitude
Des relations, telles que les effets secondaires et le dosage des médicaments

Choisir entre l'API Healthcare Natural Language et AutoML Entity Extraction for Healthcare

L'API Healthcare Natural Language propose des modèles de langage naturel pré-entraînés pour extraire les concepts médicaux et relations du texte médical. L'API Healthcare Natural Language mappe le texte dans un ensemble prédéfini de catégories de connaissances médicales.

AutoML Entity Extraction for Healthcare vous permet de créer un modèle d'extraction d'entité personnalisé entraîné à l'aide de votre propre texte médical annoté et de vos propres catégories. Pour en savoir plus, consultez la documentation sur AutoML Entity Extraction for Healthcare.

Régions acceptées

L'API Healthcare Natural Language est disponible dans les emplacements suivants :

Nom du lieu	Description de l'emplacement
`asia-south1`	Mumbai, Inde
`australia-southeast1`	Sydney, Australie
`europe-west2`	Londres, Royaume-Uni
`europe-west4`	Pays-Bas
`northamerica-northeast1`	Montréal, Canada
`us-central1`	Iowa, États-Unis

Fonctionnalités de l'API Healthcare Natural Language

L'API Healthcare Natural Language inspecte le texte pour rechercher des concepts médicaux et des relations. Vous pouvez effectuer une analyse des entités à l'aide de la méthode analyzeEntities.

Requêtes d'analyse des entités

L'API Healthcare Natural Language est une API REST qui comprend des requêtes et réponses JSON. Les sections suivantes expliquent comment extraire différentes informations médicales à partir d'un texte médical donné:

La requête d'analyse des entités contient les champs suivants:

documentContent : données de la requête, composées d'un texte médical. La taille maximale du texte médical est de 20 000 caractères Unicode.
licensedVocabularies[] : facultatif. Vocabulaire SNOMED CT. Disponible uniquement pour les utilisateurs aux États-Unis.
alternativeOutputFormat : facultatif. Format du bundle FHIR.

Champs d'une réponse d'analyse des entités

L'analyse des entités renvoie un ensemble de mentions de connaissances médicales, de concepts médicaux et de relations entre ces mentions, y compris les suivantes:

entityMentions: occurrences d'entités de connaissances médicales dans le texte médical source. Chaque mention d'entité comporte les champs suivants :
- mentionId: identifiant unique d'une entité mentionnée dans la réponse.
- type: catégorie de connaissances médicales de la mention d'entité.
- text: comprend le champ textContent et décrit l'extrait du texte médical contenant la mention de l'entité, et offset, l'emplacement de la mention d'entité dans le texte médical source.
- temporalAssessment: spécifie la relation entre l'entité associée et la mention d'entité (CURRENT, CLINICAL_HISTORY, FAMILY_HISTORY, UPCOMING ou OTHER).
- certaintyAssessment: négation ou qualification du concept médical, parmi LIKELY, SOMEWHAT_LIKELY, UNCERTAIN, SOMEWHAT_UNLIKELY, UNLIKELY ou CONDITIONAL.
- subject: spécifie l'objet auquel se rapporte le concept médical (PATIENT, FAMILY_MEMBER ou OTHER).
- linkedEntities: liste de concepts médicaux pouvant être liés à cette mention d'entité. Les entités associées spécifient entityId, qui associe un concept médical à une entité dans entities.
entities: décrit les concepts médicaux issus des champs des entités associées. Chaque entité est décrite à l'aide des champs suivants :
- entityId: identifiant unique du champ linkedEntities.
- preferredTerm: terme privilégié pour désigner le concept médical.
- vocabularyCodes: représentation du concept médical dans les vocabulaires médicaux compatibles.
relationships: permet de définir des relations dirigées entre les mentions d'entités. Dans l'exemple, le sujet de la relation est "Régimes d'insuline humain" et l'objet de la relation est "5 unités".
confidence: indique le niveau de confiance du modèle dans la relation, sous la forme d'un nombre compris entre 0 et 1.

Outre les champs répertoriés, la réponse peut également contenir le champ additionalInfo, qui indique toute description supplémentaire du type de mention d'entité. Consultez la section Informations supplémentaires.

Langues disponibles

L'API Healthcare Natural Language ne permet d'extraire que des informations médicales d'un texte en anglais.

Vocabulaire médical compatible

L'API Healthcare Natural Language accepte les vocabulaires suivants :

Foundational Model of Anatomy
Gene Ontology
HUGO Gene Nomenclature Committee
Human Phenotype Ontology
ICD-10 Procedure Coding System
ICD-10-CM
ICD-9-CM
LOINC
MeSH
MedlinePlus Health Topics
Metathesaurus Names
NCBI Taxonomy
NCI Thesaurus
National Drug File
Online Mendelian Inheritance in Man
RXNORM
SNOMED CT (disponible uniquement pour les utilisateurs des États-Unis)

Catégories d'informations médicales compatibles

L'API Healthcare Natural Language attribue une catégorie de connaissances médicales au champ entityMentions.type. Voici la liste des catégories de connaissances médicales acceptées : Les types de mentions d'entités appartenant aux groupes d'oncologie, de déterminants sociaux (SDOH) et d'informations de santé protégées (PHI) ne sont disponibles qu'en version preview:

Groupe	Catégorie d'information médicale	Description
Général	`ANATOMICAL_STRUCTURE`	Partie complexe du corps humain, telle que les cellules, les organes et les systèmes.
	`BODY_FUNCTION`	Fonction exécutée par le corps humain.
	`BF_RESULT`	Résultat d'une fonction du corps.
	`BODY_MEASUREMENT`	Mesure normale du corps humain, telle que les signes vitaux, obtenue sans tests ou procédures complexes à l'aide d'instruments de base, comme un thermomètre ou un stéthoscope.
	`BM_RESULT`	Résultat d'une mesure corporelle.
	`BM_UNIT`	Unité de mesure corporelle.
	`BM_VALUE`	Valeur d'une mesure corporelle.
	`LABORATORY_DATA`	Les résultats du test d'un échantillon de corps.
	`LAB_RESULT`	Description qualitative des données de laboratoire, telle que « augmentée », « a diminuée », « positive » ou « négative ».
	`LAB_VALUE`	Valeur d'une instance des données de laboratoire.
	`LAB_UNIT`	Unité de mesure de la valeur de laboratoire.
	`MEDICAL_DEVICE`	Instrument physique ou virtuel.
	`MEDICINE`	Médicament ou autre préparation pour le traitement ou la prévention d'une maladie.
	`MED_DOSE`	Dos d'un médicament.
	`MED_DURATION`	Période d'administration d'un médicament.
	`MED_FORM`	Caractéristiques physiques d'un médicament spécifique.
	`MED_FREQUENCY`	Fréquence à laquelle un médicament est pris.
	`MED_ROUTE`	Endroit dans le corps où un médicament est administré.
	`MED_STATUS`	L’état d’un médicament existant, tel que « continuer », « recommencer », « redémarrer », « arrêter », « changer », « augmenter » et « diminuer ».
	`MED_STRENGTH`	Quantité de l’ingrédient actif dans une dose d’un médicament.
	`MED_UNIT`	Unité de mesure du principe actif d’un médicament.
	`MED_TOTALDOSE`	Quantité de médicaments à prendre en une fois.
	`PROBLEM`	Maladie de santé, y compris les résultats et les maladies.
	`PROCEDURE`	Une procédure de diagnostic ou de traitement.
	`PROCEDURE_RESULT`	Les résultats d'une procédure.
	`PROC_METHOD`	La méthode utilisée pour mener une procédure.
	`SEVERITY`	Gravité de la maladie.
	`SUBSTANCE_ABUSE`	Description de l'abus d'une substance psychoactive.
Oncology (Preview)	`CLINICAL_STATUS`	État d'un cas de cancer, tel que "actif", "récurrent", "récurrent" et "résolu".
	`DATE`	Annotation de date (date du diagnostic, date de l'intervention ou date d'un traitement de rayonnement, par exemple). Il extrait tous les éléments d'une date et peut ne pas inclure l'année.
	`DIMENSIONS`	Mesures d'une tumeur, d'une masse ou d'une croissance anormale.
	`GENE_STUDIED`	Les gènes étudiés qui conduisent directement ou indirectement à la formation de tumeurs, tels que BRCA1, p53 et ALK.
	`HISTOLOGICAL_GRADE`	Système de classification pour noter l'apparence d'une cellule cancéreuse.
	`LAB_SPECIMEN`	Matériel biologique récolté auprès de l'organisme à des fins de test ou d'échantillonnage.
	`RADIATION_DOSAGE`	Quantité de rayonnements donnés à un patient.
	`ONSET`	Annotation de date pour représenter la date à laquelle un patient a observé pour la première fois des problèmes liés au cancer.
	`VARIATION_CODE`	Code attribué à la variante génomique spécifique qui est détecté dans un système de codage principal tel que ClinVar et HGVS.
Déterminants sociaux de la santé (SDoH) (preview)	`AGE`	Identifiant de l'âge. Sont concernées les expressions qui décrivent l'âge, telles que "a l'air d'avoir l'air inférieur à l'âge indiqué", "d'âge mûr", "78 ans" ou "adolescent". Remarque: La loi HIPAA ne classe l'âge d'une personne dans la catégorie des données de santé protégées que si celle-ci est supérieure à 90 ans. Pour en savoir plus, consultez le résumé des règles de confidentialité HIPAA.
	`FAMILY`	Expressions décrivant la structure familiale du patient ou ses proches, comme "marié avec deux enfants", "frère", "épouse", "parents favorables" ou "divorcé"
	`LIVING_SITUATION`	Expressions décrivant la situation de vie du patient, par exemple "avec un colocataire", "une infirmière en soins à domicile 24h/24, 7j/7" ou "a déménagé récemment".
	`SOCIAL_IDENTITY`	Expressions décrivant l'identité sociale du patient ou de la famille, y compris l'origine ethnique, l'orientation sexuelle, la religion, la nationalité, les langues parlées ou non, ou le pays d'origine.
	`PHYSICAL_APPEARANCE`	Expressions décrivant la caractéristique physique la plus visible ou la plus évidente du patient ou de la famille, comme "cicatrice sur la joue droite", "syndrome de Down", "obésité" ou "amputé de la jambe gauche".
	`OCCUPATION`	Expressions décrivant la profession et la situation professionnelle du patient ou de sa famille, comme "mère retraitée", "a travaillé comme soudeur depuis 20 ans" ou "perdu son emploi l'année dernière".
Données de santé protégées (version preview)	`PERSON_NAME`	Identifiant générique du nom d'une personne. Inclut des titres tels que "Dr", "Mme" ou "MD"
	`ORGANIZATION_NAME`	Identifiant d'un organisme médical qui collecte des données de santé protégées, tel qu'une clinique, un centre de soins infirmiers ou un hôpital.
	`GENERIC_ID`	Identifiant générique qui identifie les dossiers médicaux, les patients, les médecins et les hôpitaux (numéro de sécurité sociale du patient ou numéro d'un prestataire, par exemple).
	`LOCATION`	Un emplacement géographique peut contenir le nom et le numéro de bâtiments, de rues, de villes, d'États ou de codes postaux.
	`PHONE_NUMBER`	Numéro pour indiquer un numéro de téléphone, de fax ou de bipeur.
	`EMAIL_ADDRESS`	Identifiant d'adresse e-mail.
	`URL`	Adresse d'un site Web.
	`ZIPCODE`	Identifiant de code postal.

Catégories de fonctionnalités fonctionnelles disponibles

L'API Healthcare Natural Language peut induire les fonctionnalités fonctionnelles, ou attributs, d'une entité mentionnée à partir du contexte. Par exemple, dans la phrase "La mère de Kusuma a le diabète", la condition "diabète" a la fonctionnalité fonctionnelle de subject FAMILY_MEMBER.

Relations temporelles

Les relations temporelles, renvoyées dans le champ temporalAssessment, décrivent la relation temporelle entre cette mention d'entité et le sujet.

L'API Healthcare Natural Language accepte les relations temporelles suivantes :

CURRENT
CLINICAL_HISTORY
FAMILY_HISTORY
UPCOMING
OTHER

Objets

Le sujet, renvoyé dans le champ subject, décrit la personne à laquelle se rapporte la mention d'entité.

L'API Healthcare Natural Language accepte les sujets suivants :

PATIENT
FAMILY_MEMBER
OTHER

Évaluations de certitude

Les évaluations de certitude, renvoyées dans le champ certaintyAssessment, décrivent la confiance du preneur de notes initial. Par exemple, si la note d'origine contient "Le patient présente des maux de gorge", l'évaluation de certitude renvoie la valeur LIKELY pour indiquer que le preneur de notes est confiant qu'il était probable que le patient présentait des maux de gorge. Si la note d'origine contient "Le patient ne présente pas de maux de gorge", l'évaluation de certitude renvoie la valeur UNLIKELY pour indiquer que le preneur de notes est confiant qu'il n'était pas probable que le patient présente des maux de gorge.

Les évaluations de certitude peuvent être associées à l'une des valeurs suivantes :

LIKELY
SOMEWHAT_LIKELY
UNCERTAIN
SOMEWHAT_UNLIKELY
UNLIKELY
CONDITIONAL

Informations supplémentaires

Le champ additionalInfo fournit des informations supplémentaires sur une mention d'entité. Par exemple, le champ additionalInfo pour une mention d'entité DATE peut contenir des détails sur le type de date, classés dans l'une des catégories suivantes:

ADMISSION_DATE
CONSULTATION_DATE
DISCHARGE_DATE
SERVICE_DATE
VISIT_DATE
DIAGNOSIS_DATE
MED_STARTED_DATE
MED_ENDED_DATE
NOTE_DATE
PROCEDURE_DATE
RADIATION_STARTED_DATE
RADIATION_ENDED_DATE
STAGE_DATE

Relations acceptées entre les mentions d'entités

L'API Healthcare Natural Language peut induire les relations entre les mentions d'entité en fonction du texte médical environnant. Dans la réponse, le sujet de la relation est identifié par subjectId et l'objet de la relation est identifié par objectId.

L'API Healthcare Natural Language accepte les relations suivantes entre les mentions d'entité :

Objet	Objet
`ANATOMICAL_STRUCTURE`	`MEDICAL_DEVICE`
`BODY_FUNCTION`	`BF_RESULT`
`BODY_MEASUREMENT`	`BM_RESULT`
`BODY_MEASUREMENT`	`BM_UNIT`
`BODY_MEASUREMENT`	`BM_VALUE`
`LABORATORY_DATA`	`LAB_RESULT`
`LABORATORY_DATA`	`LAB_UNIT`
`LABORATORY_DATA`	`LAB_VALUE`
`MEDICINE`	`MED_DOSE`
`MEDICINE`	`MED_DURATION`
`MEDICINE`	`MED_FORM`
`MEDICINE`	`MED_FREQUENCY`
`MEDICINE`	`MED_ROUTE`
`MEDICINE`	`MED_STATUS`
`MEDICINE`	`MED_STRENGTH`
`MEDICINE`	`MED_TOTALDOSE`
`MEDICINE`	`MED_UNIT`
`PROBLEM`	`ANATOMICAL_STRUCTURE`
`PROBLEM`	`MEDICINE`
`PROBLEM`	`PROCEDURE`
`PROBLEM`	`SEVERITY`
`PROCEDURE`	`ANATOMICAL_STRUCTURE`
`PROCEDURE`	`PROC_METHOD`
`PROCEDURE`	`PROCEDURE_RESULT`
`SUBSTANCE_ABUSE`	`SEVERITY`

Sortie de l'API Healthcare Natural Language sous forme de bundle FHIR

Lorsque vous demandez la méthode analyzeEntities avec le champ alternativeOutputFormat défini sur FHIR_BUNDLE, la réponse inclut les objets JSON suivants:

L'entité mentionne, les entités et les relations
Un bundle FHIR R4 représenté sous forme de chaîne, qui inclut toutes les entités, les mentions d'entité et les relations au format JSON

Pour créer le bundle FHIR R4, l'API Healthcare Natural Language mappe les mentions d'entité, les entités et les relations avec les ressources FHIR et leurs éléments. Le tableau suivant répertorie certains de ces mappages.

Mentions des entités de l'API Healthcare Natural Language	Catégorie des connaissances médicales	Ressources et éléments FHIR R4
`PROBLEM`		`Condition`
`PROBLEM`		`Condition.category`
`PROBLEM`		`Condition.status`
`PROBLEM`	`ANATOMICAL_STRUCTURE`	`Condition.bodySite`
`PROBLEM`	`ANATOMICAL_STRUCTURE`	`Condition.evidence`
`PROBLEM`	`SEVERITY`	`Condition.severity`
`PROCEDURE`		`Procedure`
`PROCEDURE`		`Procedure.status`
`PROCEDURE`		`Procedure.code`
`PROCEDURE`	`ANATOMICAL_STRUCTURE`	`Procedure.bodySite`
`PROCEDURE`	`MEDICAL_DEVICE`	`Procedure.usedCode`
`PROCEDURE`	`PROBLEM`	`Procedure.reasonReference`
`MEDICINE`		`MedicationStatement`
`MEDICINE`		`MedicationStatement.status`
`MEDICINE`		`MedicationStatement.medication`
`MEDICINE`	`PROBLEM`	`MedicationStatement.reasonReference`
`MEDICINE`	`MED_DOSE`	`MedicationStatement.dosage.doseAndRate.doseQuantity`
`MEDICINE`	`MED_FREQUENCY`	`MedicationStatement.dosage.text`
`MEDICINE`	`MED_ROUTE`	`MedicationStatement.dosage.route`
`MEDICINE`	`MED_STRENGTH`	`MedicationStatement.dosage.doseAndRate.doseQuantity`
`MEDICINE`	`MED_UNIT`	`MedicationStatement.dosage.doseAndRate.doseQuantity`

Pour extraire des entités d'un texte en tant que bundle FHIR R4, consultez la section Extraire la sortie en tant que bundle FHIR R4.