Consultez la page Speech-to-Text pour en savoir plus sur les modèles, les fonctionnalités avancées et la possibilité de transcrire des fichiers jusqu'à huit heures.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Convert speech to text\n\nThis page shows you how to use Vertex AI Studio to convert speech to text.\n\nTo learn how to convert text to speech, see\n[Convert text to speech](/vertex-ai/generative-ai/docs/speech/text-to-speech).\n\nConvert speech to text\n----------------------\n\nTo convert speech to text, do the following:\n\n1. In the Vertex AI section of the Google Cloud console, go to\n the **Vertex AI Studio** page.\n\n [Go to Vertex AI Studio](https://console.cloud.google.com/vertex-ai/studio/overview)\n2. Click **Generate speech**.\n\n3. Select the **Speech-to-text** tab.\n\n4. In **Speech** , click **Browse** to select the audio file that you want to\n convert to text.\n\n5. In the **Language** selector box, select the language of the speech in the\n audio file.\n\n6. Click **Submit**.\n\n The converted text appears in **Text**.\n\nLimitations\n-----------\n\n- Audio files can be a maximum 60 seconds or 10 MB (whichever is less).\n- Files are transcribed with the [Chirp](https://cloud.google.com/speech-to-text/v2/docs/usm/usm-model) model.\n- Only 16-bit linear PCM WAV files are supported.\n\nYou can use the [Speech-to-Text UI](/speech-to-text/docs/transcribe-console) directly to overcome these limitations.\n\nWhat's next\n-----------\n\n- For more models, advanced features, and ability to transcribe files up to 8 hours, see [Speech-to-Text](/speech-to-text/docs/transcribe-console)."]]