Speech-to-Text fournit le modèle latest_short
pour la reconnaissance vocale constituée d'énoncés uniques. Cela peut être utile pour les applications dans lesquelles les utilisateurs émettent des commandes vocales uniques, par opposition aux longs monologues ou à une dictée.
Lorsqu'un outil de reconnaissance avec le modèle latest_short
est utilisé pour une requête de reconnaissance, Speech-to-Text arrête d'effectuer la reconnaissance une fois qu'un énoncé est détecté. Speech-to-Text renvoie une réponse d'événement d'activité vocale avec le type END_OF_SINGLE_UTTERANCE
suivi des résultats de la transcription.
Énoncé unique et StreamingRecognize
Dans le cas où un modèle latest_short
Recognizer
est sélectionné pour une requête StreamingRecognize
, Speech-to-Text ferme automatiquement le flux à la fin de l'énoncé.
Avec les événements de l'activité Voice
Si les événements de l'activité Voice ont également été activés pour une requête StreamingRecognize, Speech-to-Text renvoie toujours les événements d'activité Voice de début et de fin. Les délais avant expiration de l'activité Voice au début de la reconnaissance vocale continuent de s'appliquer. Les délais avant expiration de l'activité Voice à la fin de la reconnaissance vocale ne seront pas appliqués, car le flux sera fermé dès la fin de l'énoncé.