Présentation

L'API Cloud Healthcare (Dictée) fournit une solution gérée pour le stockage des données de dictée.

Remarque : La documentation des autres modalités de l'API Cloud Healthcare est disponible ici.

Modèle de données

L'API Cloud Healthcare (Dictée) traite les ressources suivantes :

Dataset
- DictationStore
  - Dictation
    - Note
- SpeechConfig

Les Dictées stockent des segments de contenu audio. Le contenu audio peut être vide ou effacé, ce qui permet de ne stocker que les notes transcrites. Il est possible de marquer le contenu audio comme "allow_training".

Les Notes sont des ressources enfants des données de Dictées. Une seule dictée peut avoir plusieurs notes. Les notes contiennent les résultats de données de dictée. Elles peuvent stocker des transcriptions corrigées.

Les éléments SpeechConfigs stockent la configuration de reconnaissance vocale. Ils peuvent être réutilisés pour plusieurs requêtes ASR et peuvent être mappés avec un système externe facilitant l'entraînement et l'adaptation à différents locuteurs.

Un ensemble de données peut contenir un nombre illimité de datastores. Le schéma suivant présente un projet comportant plusieurs ensembles de données, chacun contenant plusieurs datastores.

ensemble de données

Zones

Le stockage des données de dictée respecte les contraintes de localité de l'API Cloud Healthcare (la documentation complémentaire concernant l'attribution d'ensembles de données aux emplacements est disponible ici). Toutefois, les opérations Recognize sont effectuées par un service mondial. Par conséquent, le traitement peut apparaître en dehors de la région de stockage spécifiée.