Reconhecer fala usando modelos médicos

A Speech-to-Text oferece dois modelos médicos, além dos outros modelos de reconhecimento de fala padrão e aprimorado. Os modelos médicos são adaptados especificamente para o reconhecimento de palavras comuns em cenários médicos, como diagnósticos, medicamentos, sintomas, tratamentos e condições. Se você quiser reconhecer esse tipo de dados de áudio, é possível melhorar os resultados da transcrição usando esses modelos.

Existem dois modelos médicos, cada um personalizado para casos de uso específicos:

  • medical_conversation: para conversas entre um prestador de serviços médicos, por exemplo, uma médica/enfermeira e um paciente. Use esse modelo quando ambos os profissionais e um paciente estiverem falando. As palavras faladas por cada pessoa são detectadas e rotuladas automaticamente na transcrição retornada.
  • medical_dictation: para anotações ditadas por um único servidor de serviços médicos, por exemplo, um médico fazendo observações sobre os resultados do exame de sangue de um paciente.

Use modelos médicos apenas com as seguintes características da Speech-to-Text. Os recursos omitidos nesta lista não podem ser usados com nenhum modelo médico.

Diarização incorporada

O modelo medical_conversation usa a diarização incorporada integrada para separar os dois falantes. A diarização incorporada que esse modelo usa é um recurso diferente da diarização de falante do Speech-to-Text. Por esse motivo, não é possível usar o recurso de diarização do falante do Speech-to-Text com o modelo medical_conversation.

A diarização incorporada detecta automaticamente o médico e o paciente que estão falando e anexa rótulos às palavras transcritas para indicar quem estava falando. Por exemplo, é possível receber uma transcrição semelhante ao seguinte: "Okay, any cough or chest pain? spk:provider I cough infrequently , but no , uh , chest pain spk:patient". O termo spk:provider aparece depois da frase falada pelo médico, indicando que essa frase foi falada pelo provedor de serviços médicos. Da mesma forma, spk:patient aparece após a frase falada pelo paciente.

Envie uma solicitação de transcrição

REST e LINHA DE CMD

A amostra de código a seguir usa o modelo medical_conversation para transcrever um arquivo de áudio em um bucket público do Cloud Storage.

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

  • LANGUAGE_CODE: o código BCP-47 do idioma falado no seu clipe de áudio. Os modelos médicos estão disponíveis apenas para en-US.
  • ENCODING: a codificação do áudio que você quer transcrever. Se você estiver usando a amostra de áudio público, a codificação será LINEAR16.

Método HTTP e URL:

POST https://speech.googleapis.com/v1/speech:recognize

Corpo JSON da solicitação:

{
  "config": {
    "languageCode":LANGUAGE_CODE,
    "encoding":ENCODING
    "model": medical_conversation
  },
  'audio':{
    'uri':'gs://cloud-samples-data/speech/medical_conversation_2.wav'
  }

Para enviar a solicitação, expanda uma destas opções:

Você receberá uma resposta JSON semelhante a esta:

  "results": [
    {
      "alternatives": [
        {
          "transcript": "Um-hum . Yeah. spk:patient Hello , good morning . spk:provider Good
          morning . spk:patient So , tell me what's going on . spk:provider Uh , sure , so , um , I
          woke up probably three or four days ago , which , uh , wheezing and short of breath .
          spk:patient Okay , any cough or chest pain ? spk:provider I cough infrequently , but no ,
          uh , chest pain . spk:patient Have you been exposed to anyone with covid ? spk:provider
          Uh , no , and I also took a test , which was negative . spk:patient Uh , is it getting
          worse , or better ? spk:provider Uh , it has been getting a lot worse"
        }
      ]
    },
    {
      "alternatives": [
        {
          "transcript": "Okay . Was there something that triggered this exposure to cold , for
          example ? spk:provider Um , I had a gone hiking , and I got caught in the rain the day
          before this all started . spk:patient"
        }
      ]
    }
  ]
}