Cette page a été traduite par l'API Cloud Translation.

Reconnaissance vocale

Cette page vous explique comment utiliser Vertex AI Studio pour la conversion speech to text.

Pour savoir comment procéder à la synthèse vocale, consultez la page Synthèse vocale.

Pour convertir la voix en texte, procédez comme suit:

Dans la section Vertex AI de la Google Cloud console, accédez à la page Vertex AI Studio.

Accéder à Vertex AI Studio
Cliquez sur Générer la parole.
Sélectionnez l'onglet Reconnaissance vocale.
Dans Voix, cliquez sur Parcourir pour sélectionner le fichier audio que vous souhaitez convertir en texte.
Dans la zone de sélection Langue, sélectionnez la langue de la voix dans le fichier audio.
Cliquez sur Envoyer.

Le texte converti apparaît dans Texte.

Limites

Les fichiers audio peuvent avoir une durée maximale de 60 secondes ou de 10 Mo (la valeur la plus faible étant atteinte).
Les fichiers sont transcrits avec le modèle Chirp.
Seuls les fichiers WAV linéaires PCM 16 bits sont acceptés.

Vous pouvez utiliser l'interface utilisateur de Speech-to-Text directement pour contourner ces limites.

Consultez la page Speech-to-Text pour en savoir plus sur les modèles, les fonctionnalités avancées et la possibilité de transcrire des fichiers jusqu'à huit heures.