Configurer Speech-to-Text

Speech-to-Text est une API optimisée par la technologie d'intelligence artificielle (IA) de Google. Vous envoyez vos données audio à Speech-to-Text, puis vous recevez en réponse une transcription de vos données audio.

Pour en savoir plus sur la construction d'une requête Speech-to-Text, consultez la page Requêtes.

Présentation

Avant de pouvoir envoyer des requêtes à Speech-to-Text, vous devez activer l'API dans Google Cloud Console. Les étapes décrites sur cette page vous guident à travers les actions suivantes :

Activez Speech-to-Text sur un projet.
Assurez-vous que la facturation est activée pour Speech-to-Text.
(Facultatif) Créez un bucket Google Cloud Storage pour stocker vos données audio.

Avant de commencer

Il existe deux façons d'accéder au service : en utilisant l'API REST ou la console Speech-to-text. Nous vous fournissons des exemples de code qui vous montrent comment envoyer une requête à l'API REST et recevoir une réponse. Vous pouvez apprendre à utiliser ces exemples en suivant les guides de démarrage rapide et les guides d'utilisation de Speech-to-Text. Si vous préférez utiliser Speech-to-Text avec un minimum de codage, servez-vous de la console Cloud Speech-to-Text.

Ce guide vous explique les étapes nécessaires pour commencer à envoyer des requêtes à l'API REST. Si vous débutez avec le codage, nous vous recommandons de commencer par les tutoriels détaillés dans Google Cloud Platform avant de commencer.

Configurer votre projet Google Cloud pour Speech-to-Text

Se connecter à la console Google Cloud
Accéder à la page de sélection du projet

Vous pouvez sélectionner un projet existant ou en créer un. Pour en savoir plus sur la création d'un projet, consultez la page Créer et gérer des projets.
Si vous créez un nouveau projet, vous serez invité à y associer un compte de facturation. Si vous utilisez un projet préexistant, assurez-vous que la facturation est activée.

Découvrez comment vérifier que la facturation est activée pour votre projet.

Remarque : Vous devez activer la facturation pour utiliser l'API Speech-to-Text, mais vous ne serez facturé que si vous dépassez le quota gratuit. Pour en savoir plus, consultez la page des tarifs.
Une fois que vous avez sélectionné un projet et que vous l'avez associé à un compte de facturation, vous pouvez activer l'API Speech-to-Text. Accédez à la barre Rechercher des produits et des ressources en haut de la page et saisissez "parole". Sélectionnez l'API Cloud Speech-to-Text dans la liste des résultats.
Pour essayer Speech-to-Text sans l'associer à votre projet, sélectionnez l'option ESSAYER CETTE API. Pour activer l'API Speech-to-Text afin de l'utiliser avec votre projet, cliquez sur ACTIVER.
(Facultatif) Activez la journalisation des données. En activant la journalisation des données, vous autorisez Google à enregistrer les données audio que vous envoyez à Speech-to-Text. Ces données sont utilisées pour améliorer les modèles Speech-to-Text. Les utilisateurs qui activent la journalisation des données bénéficient d'un tarif plus avantageux. Pour en savoir plus, consultez les Conditions d'utilisation des tarifs et de la journalisation des données.

Facultatif : créer un bucket Cloud Storage

Si vous avez l'intention de transcrire des fichiers audio d'une durée supérieure à 60 secondes ou d'une taille supérieure à 10 Mo, vous devez stocker les données audio dans un bucket Cloud Storage avant de pouvoir les transcrire à l'aide de Speech-to-Text. Les étapes suivantes vous guident tout au long du processus de création d'un bucket.

Dans la console Google Cloud, accédez à la page Buckets Cloud Storage.

Accéder à la page "Buckets"

Cliquez sur Créer un bucket.

Sur la page Créer un bucket, saisissez les informations concernant votre bucket. Pour passer à l'étape suivante, cliquez sur Continuer.

Pour nommer votre bucket, saisissez un nom unique. N'incluez aucune information sensible dans le nom des buckets, car leur espace de noms est global et visible par tous.
Pour Choisir l'emplacement de stockage des données, procédez comme suit :
- Sélectionnez une option de type d'emplacement.
- Sélectionnez une option Location (Emplacement).
Pour Choisir une classe de stockage par défaut pour vos données, sélectionnez une classe de stockage.
Pour le champ Choisir comment contrôler l'accès aux objets, sélectionnez une option de Contrôle des accès.
Sous Paramètres avancés (facultatif), choisissez une méthode de chiffrement, une règle de conservation ou des libellés de bucket.

Cliquez sur Create (Créer).

Désactiver l'API Speech-to-Text

Suivez la procédure ci-dessous si vous n'avez plus besoin d'utiliser l'API Speech-to-Text à l'avenir.

Accédez à votre tableau de bord Google Cloud, puis cliquez sur le lien Accéder à la présentation des API dans la zone API.
Sélectionnez API Cloud Speech-to-Text.
Cliquez sur le bouton DÉSACTIVER L'API en haut de la page de l'API Cloud Speech-to-Text.

Étape suivante

Découvrez comment envoyer une requête de transcription à l'API Speech-to-Text à l'aide de bibliothèques clientes, de gcloud, de la ligne de commande ou de l'UI de Speech-to-Text.