Guía de inicio rápido

En esta página, se muestra cómo realizar operaciones básicas específicas de la modalidad de dictado de la API de Cloud Healthcare.

Antes de comenzar

La guía de inicio rápido general de la API de Cloud Healthcare se puede encontrar aquí. En las siguientes instrucciones, se da por sentado que completaste los pasos para configurar el proyecto en esa guía de inicio rápido.

Almacena y recupera datos de dictado

Elige un nombre para tu almacén de dictados:

DICTATIONSTORE=mydictationstore

Crea un almacén de dictados dentro de tu conjunto de datos:

curl -X POST --data '{"trainingConsent":"ALLOW"}' \
    https://healthcare.googleapis.com/v1alpha2/projects/${PROJECT_ID?}/locations/${LOCATION?}/datasets/${DATASET?}/dictationStores?access_token=${TOKEN?}\&dictation_store_id=${DICTATIONSTORE?}

Inserta un dictado en el almacén de dictados:

curl -H "Content-Type: application/json" -X POST --data \
    '{"name":"dictation1", "audio":{"uri":"gs://dictations/speech/DrJohnson.flac"}}' \
    https://healthcare.googleapis.com/v1alpha2/projects/${PROJECT_ID?}/locations/${LOCATION?}/datasets/${DATASET?}/dictationStores/${DICTATIONSTORE?}/dictations?access_token=${TOKEN?}\&return_mask=name

Configura y realiza reconocimiento de voz

Inserta el objeto SpeechConfig que describe los parámetros de reconocimiento de voz y el formato de archivo que coinciden con el audio de dictado de 3 en el almacén de dictado (este objeto se puede reutilizar para varios dictados):

curl -H "Content-Type: application/json" -X POST --data \
    '{"name":"speechConfig1", "recognition_config":{"encoding":"FLAC", "sampleRateHertz":"16000"},"speakerHumanName":"Jeremy"}' \
    https://healthcare.googleapis.com/v1alpha2/projects/${PROJECT_ID?}/locations/${LOCATION?}/datasets/${DATASET?}/dictationStores/${DICTATIONSTORE?}/speechConfigs?access_token=${TOKEN?}

ID de registro para el dictado y SpeechConfig de las respuestas a las llamadas del método anteriores. Los siguientes ID sirven solo como ejemplos; reemplázalos por los que se obtienen de las llamadas que crearon el dictado y SpeechConfig.

DICTATION_ID=63411d4f-7d36-491f-9ed4-424786fa64d9
SPEECHCONFIG_ID=9235fa21-0180-4efc-b033-306b0e187335

Realiza la operación de reconocimiento de voz:

curl -H "Content-Type: application/json" -X POST  --data \
    '{"speechConfigName":"projects/'${PROJECT_ID?}'/locations/'${LOCATION?}'/datasets/'${DATASET?}'/dictationStores/'${DICTATIONSTORE}'/speechConfigs/'${SPEECHCONFIG_ID}'"}' \
    https://healthcare.googleapis.com/v1alpha2/projects/${PROJECT_ID?}/locations/${LOCATION?}/datasets/${DATASET?}/dictationStores/${DICTATIONSTORE}/dictations/${DICTATION_ID?}:recognize?access_token=${TOKEN?}

¿Qué sigue?

Revisa la documentación.