Documentation de référence sur l'API RPC Speech-to-Text

Il s'agit de la documentation de référence de l'API gRPC pour Speech-to-Text. Il s'agit de l'une des API pré-entraînées Vertex AI disponibles sur l'appliance Google Distributed Cloud sous air gap (GDC).

Utilisez ce guide pour intégrer par programmation les technologies de reconnaissance vocale aux applications en cours de développement. Envoyez des fichiers audio et recevez-en une transcription par le biais de l'API Speech-to-Text de Vertex AI. Par exemple, si vous envoyez un fichier audio en espagnol, vous obtiendrez une transcription textuelle correspondante en espagnol.

Méthodes Speech-to-Text

Deux méthodes sont disponibles dans GDC :

  • Recognize : effectue une reconnaissance vocale synchrone. Recognize reçoit les résultats après que toutes les données audio ont été envoyées et traitées.
  • StreamingRecognize : effectue une reconnaissance vocale en continu bidirectionnelle. StreamingRecognize reçoit les résultats tout en envoyant les données audio.