Speech-to-Text offre due modelli medici oltre agli altri modelli di riconoscimento vocale standard e avanzati. I modelli medici sono pensati appositamente per il riconoscimento di parole comuni in ambito medico, come diagnosi, farmaci, sintomi, cure e condizioni. Se vuoi riconoscere questo tipo di dati audio, puoi migliorare i risultati della trascrizione utilizzando questi modelli.
Esistono due modelli medici, ognuno dei quali è pensato appositamente per casi d'uso specifici:
medical_conversation
: per le conversazioni tra un medico, ad esempio un medico o un infermiere, e un paziente. Usa questo modello quando parla sia un fornitore sia un paziente. Le parole pronunciate da ogni relatore vengono rilevate automaticamente ed etichettate nella trascrizione restituita.medical_dictation
: per le note dettate da un singolo medico, ad esempio un medico che detta note sui risultati dei test del sangue di un paziente.
Utilizza i modelli medici solo con le seguenti funzionalità di Speech-to-Text Le funzionalità omesse da questo elenco non possono essere utilizzate con nessuno dei due modelli medici. La funzione di punteggiatura automatica è abilitata per impostazione predefinita.
- Punteggiatura automatica
- Trascrizioni alternative
- Timestamp delle parole
- Sicurezza a livello di parola
Il modello per conversazioni mediche supporta le seguenti funzionalità:
Il modello di dettatura medica supporta le seguenti funzionalità:
Invio di una richiesta di trascrizione
REST
L'esempio di codice riportato di seguito utilizza il modello medical_conversation
per trascrivere un file audio in un bucket Cloud Storage pubblico.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
LANGUAGE_CODE
: il codice BCP-47 della lingua parlata nel clip audio. I modelli medici sono disponibili solo per i paesi it-IT.ENCODING
: la codifica dell'audio che vuoi trascrivere. Se utilizzi un campione audio pubblico, la codifica èLINEAR16
.
Metodo e URL HTTP:
POST https://speech.googleapis.com/v1/speech:recognize
Testo JSON richiesta:
{ "config": { "languageCode":LANGUAGE_CODE, "encoding":ENCODING "model": medical_conversation }, 'audio':{ 'uri':'gs://cloud-samples-data/speech/medical_conversation_2.wav' } }
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
"results": [ { "alternatives": [ { "transcript": "Um-hum . Yeah. Hello , good morning . Good morning . So , tell me what's going on . Uh , sure , so , um , I woke up probably three or four days ago , which , uh , wheezing and short of breath . Okay , any cough or chest pain ? I cough infrequently , but no , uh , chest pain . Have you been exposed to anyone with covid ? Uh , no , and I also took a test , which was negative . Uh , is it getting worse , or better ? Uh , it has been getting a lot worse" } ] }, { "alternatives": [ { "transcript": "Okay . Was there something that triggered this exposure to cold , for example ? Um , I had a gone hiking , and I got caught in the rain the day before this all started ." } ] } ] }
Punteggiatura vocale
Il modello di dettatura medica supporta la punteggiatura vocale per le note mediche. Questa funzionalità è attiva per impostazione predefinita e non può essere disattivata. La punteggiatura pronunciata viene delimitata dalle parentesi nella trascrizione del parlato. Ad esempio, la trascrizione restituita potrebbe essere simile alla seguente:
Patient could be showing signs of trauma [question mark] They said they were [quote] having elevated heart rate [unquote]
.
Speech-to-Text supporta la seguente punteggiatura parlata:
- Punto
- Virgola
- Due punti
- maiuscole
- Barra
- trattino
- Trattino
- punto interrogativo
- Punto e virgola
- virgoletta
- non citare
- virgoletta finale
- parentesi aperta
- parentesi chiusa
- parentesi chiusa
Comandi di formattazione
Il modello di dettatura medica supporta i comandi vocali per la formattazione delle note. Questa funzionalità è attiva per impostazione predefinita e non può essere disattivata. I comandi vocali saranno definiti da parentesi nella trascrizione del parlato. Ad esempio, la trascrizione restituita potrebbe essere simile alla seguente:
[next line] Patient says they are experiencing fever [next point]
.
Speech-to-Text supporta i seguenti comandi vocali:
- punto successivo
- numero successivo
- paragrafo successivo
- maiuscole
- lettere maiuscole
- nuova riga
- elemento successivo
- problema successivo
- numero successivo del problema
- riga successiva
- sezione successiva
- numero successivo
- Gratta
- grattare
- termina dettatura
Intestazioni vocali
Il modello di dettatura medica supporta le intestazioni vocali per le note dettate. Questa funzionalità è attiva per impostazione predefinita e non può essere disattivata. Le intestazioni verranno delimitate da parentesi nella trascrizione e saranno in maiuscolo. Ad esempio, la trascrizione restituita potrebbe essere simile alla seguente:
[CURRENT MEDICATIONS] Patient is currently taking no medications
.
Speech-to-Text supporta le seguenti intestazioni vocali:
- DENUNCIA SUL CAPO
- MEDAGLIE CORRENTI
- MEDICAZIONI SULLA DISCESA
- PIANO DI SCARICA
- CRONOLOGIA FAMIGLIE
- RISULTATI
- REVISIONE DI SISTEMI
- CRONOLOGIA DELLA PRESENTE MALATTIA
- INDICAZIONI
- LABS
- CRONOLOGIA CHIRURGICA PASSATA
- ESAME FISICO
- REVISIONE DI SISTEMI
- RADIOLOGIA