Reconnaissance vocale

Cette page vous explique comment utiliser Vertex AI Studio pour la conversion speech to text.

Pour savoir comment procéder à la synthèse vocale, consultez la page Synthèse vocale.

Reconnaissance vocale

Pour convertir la voix en texte, procédez comme suit:

  1. Dans la section "Vertex AI" de la console Google Cloud, accédez à la page Vertex AI Studio.

    Accéder à Vertex AI Studio

  2. Dans la fiche Voix, cliquez sur Ouvrir.

  3. Sélectionnez l'onglet Reconnaissance vocale.

  4. Dans Voix, cliquez sur Parcourir pour sélectionner le fichier audio que vous souhaitez convertir en texte.

  5. Dans la zone de sélection Langue, sélectionnez la langue de la voix dans le fichier audio.

  6. Cliquez sur Envoyer.

    Le texte converti apparaît dans Texte.

Limites

  • Les fichiers audio peuvent avoir une durée maximale de 60 secondes ou de 10 Mo (la valeur la plus faible étant atteinte).
  • Les fichiers sont transcrits avec le modèle Chirp.
  • Seuls les fichiers WAV linéaires PCM 16 bits sont acceptés.

Vous pouvez utiliser l'interface utilisateur de Speech-to-Text directement pour contourner ces limites.

Étapes suivantes

  • Consultez la page Speech-to-Text pour en savoir plus sur les modèles, les fonctionnalités avancées et la possibilité de transcrire des fichiers jusqu'à huit heures.