Kurzanleitung

Auf dieser Seite wird erläutert, wie Sie grundlegende Vorgänge ausführen, die speziell für die Diktiermodalität der Cloud Healthcare API gelten.

Hinweis

Allgemeine Schnellstartanleitung für die Cloud Healthcare API finden Sie hier. In der folgenden Anleitung wird davon ausgegangen, dass Sie die Schritte zum Einrichten des Projekts in diesem Schnellstart ausgeführt haben.

Diktatdaten speichern und abrufen

Wählen Sie einen Namen für Ihren Diktierspeicher aus:

DICTATIONSTORE=mydictationstore

Erstellen Sie einen Dict Store in Ihrem Dataset:

curl -X POST --data '{"trainingConsent":"ALLOW"}' \
    https://healthcare.googleapis.com/v1alpha2/projects/${PROJECT_ID?}/locations/${LOCATION?}/datasets/${DATASET?}/dictationStores?access_token=${TOKEN?}\&dictation_store_id=${DICTATIONSTORE?}

So fügen Sie ein Diktat in den Diktatspeicher ein:

curl -H "Content-Type: application/json" -X POST --data \
    '{"name":"dictation1", "audio":{"uri":"gs://dictations/speech/DrJohnson.flac"}}' \
    https://healthcare.googleapis.com/v1alpha2/projects/${PROJECT_ID?}/locations/${LOCATION?}/datasets/${DATASET?}/dictationStores/${DICTATIONSTORE?}/dictations?access_token=${TOKEN?}\&return_mask=name

Spracherkennung konfigurieren und ausführen

Fügen Sie das SpeechConfig-Objekt, das die Spracherkennungsparameter und das Dateiformat beschreibt, das dem Diktat-Audio von 3 entspricht, in den Diktatspeicher ein (dieses Objekt kann für mehrere Diktate wiederverwendet werden):

curl -H "Content-Type: application/json" -X POST --data \
    '{"name":"speechConfig1", "recognition_config":{"encoding":"FLAC", "sampleRateHertz":"16000"},"speakerHumanName":"Jeremy"}' \
    https://healthcare.googleapis.com/v1alpha2/projects/${PROJECT_ID?}/locations/${LOCATION?}/datasets/${DATASET?}/dictationStores/${DICTATIONSTORE?}/speechConfigs?access_token=${TOKEN?}

Datensatz-IDs für Dictation und SpeechConfig aus Antworten auf die oben genannten Methodenaufrufe. Die folgenden IDs dienen nur als Beispiele - ersetzen Sie sie durch die IDs, die Sie aus den Anrufen erhalten haben, die Dictation und SpeechConfig erstellt haben.

DICTATION_ID=63411d4f-7d36-491f-9ed4-424786fa64d9
SPEECHCONFIG_ID=9235fa21-0180-4efc-b033-306b0e187335

Führen Sie einen Spracherkennungsvorgang durch:

curl -H "Content-Type: application/json" -X POST  --data \
    '{"speechConfigName":"projects/'${PROJECT_ID?}'/locations/'${LOCATION?}'/datasets/'${DATASET?}'/dictationStores/'${DICTATIONSTORE}'/speechConfigs/'${SPEECHCONFIG_ID}'"}' \
    https://healthcare.googleapis.com/v1alpha2/projects/${PROJECT_ID?}/locations/${LOCATION?}/datasets/${DATASET?}/dictationStores/${DICTATIONSTORE}/dictations/${DICTATION_ID?}:recognize?access_token=${TOKEN?}

Nächste Schritte

Lesen Sie die Dokumentation.