Tarifs

L'API Cloud Speech-to-Text est facturée au mois en fonction de la quantité de données audio traitées par le service, calculée par tranche de 15 secondes.

Pour consulter votre état de facturation, y compris votre utilisation et votre facture actuelle, consultez la page Facturation dans Cloud Console. Pour en savoir plus sur la gestion de votre compte, consultez la documentation Cloud Billing ou contactez l'assistance pour la facturation et les paiements.

Grille tarifaire

Fonctionnalité Modèles standards
(tous les modèles sauf les modèles améliorés dédiés aux appels téléphoniques et aux vidéos)
Modèles Premium*
(modèles améliorés dédiés aux appels téléphoniques et aux vidéos)
0 à 60 minutes Plus de 60 minutes, jusqu'à 1 million de minutes 0 à 60 minutes Plus de 60 minutes, jusqu'à 1 million de minutes
Reconnaissance vocale (journalisation des données désactivée par défaut) Gratuit 0,006 $/15 secondes** Gratuit 0,009 $/15 secondes**
Reconnaissance vocale (avec activation de la journalisation des données) Gratuit 0,004 $/15 secondes** Gratuit 0,006 $/15 secondes**

* Les modèles Premium ne sont disponibles qu'en anglais pour le moment.

** Chaque requête est arrondie à la tranche de 15 secondes supérieure.

Le coût d'utilisation de Cloud Speech-to-Text est déterminé par deux facteurs principaux :

  • Le modèle de reconnaissance utilisé (standard ou Premium)
  • L'activation ou non de la journalisation des données

Cloud Speech-to-Text exploite différents types de modèles de machine learning pour la reconnaissance vocale. Parmi eux, deux modèles offrent des performances de reconnaissance optimisées : les modèles améliorés dédiés aux appels téléphoniques et aux vidéos. Chacun de ces modèles est conçu pour un cas d'utilisation spécifique et livre de meilleurs résultats lorsqu'il est utilisé correctement.

Grâce à la journalisation des données, les clients peuvent autoriser Google à enregistrer les données audio envoyées à Cloud Speech-to-Text. Ces données permettent à Google d'améliorer ses modèles de machine learning utilisés pour la reconnaissance vocale. Les clients qui activent la journalisation des données bénéficient d'un tarif plus avantageux pour Cloud Speech-to-Text.

Ce tarif est valable pour les applications installées sur des systèmes personnels (par exemple, des téléphones, des tablettes, ainsi que des ordinateurs portables et de bureau). Si vous souhaitez utiliser l'API Speech-to-Text sur des appareils intégrés (par exemple, des voitures, des téléviseurs, des appareils ménagers ou des enceintes), veuillez nous contacter pour obtenir notre accord et connaître les tarifs.

Chaque requête est arrondie à la tranche de 15 secondes supérieure. Par exemple, pour 3 demandes distinctes, chacune contenant 7 secondes de son, vous êtes facturé 0,018 USD pour 45 secondes (3 × 15 secondes) de données audio. Les fractions de secondes sont également arrondies à la tranche de 15 secondes supérieure. Autrement dit, 15,14 secondes sont arrondies à 30 secondes et facturées comme telles.

L'utilisation mensuelle est limitée à un million de minutes. Si vous devez traiter plus d'un million de minutes de son par mois, nous aimerions en savoir plus sur vos besoins. Veuillez envoyer une demande de quota pour utiliser Cloud Speech-to-Text dans le cadre de votre projet.

Coûts de Google Cloud Platform

Si vous stockez des fichiers audio à reconnaître dans Google Cloud Storage ou si vous utilisez d'autres ressources Google Cloud Platform en même temps que Cloud Speech-to-Text (des instances Google App Engine, par exemple), ces services vous seront également facturés. Accédez au simulateur de coût Google Cloud Platform pour calculer les coûts additionnels en fonction des tarifs en vigueur.

Cette page vous a-t-elle été utile ? Évaluez-la :

Envoyer des commentaires concernant…

Documentation de l'API Cloud Speech