Quotas et limites

Ce document présente les restrictions et limites d'utilisation actuellement appliquées à l'API Cloud Speech-to-Text. Il sera mis à jour en cas de modifications de ces restrictions et limites (nous nous réservons le droit de les modifier).

Vous pouvez demander une augmentation de quota si nécessaire. Consultez la page des quotas Cloud pour savoir comment afficher et gérer votre quota.

Une fois votre demande envoyée, Google peut vous contacter pour obtenir des détails supplémentaires, et vous informer de l'approbation ou du refus de votre demande.

Limites de contenu

Le contenu de Speech-to-Text est fourni sous forme de données audio, soit directement dans le champ content de la requête, soit référencé dans une adresse URI Google Cloud Storage dans le champ uri de la requête. Une limite de 10 Mo s'applique à toutes les requêtes synchrones envoyées à l'API. Dans le cas de la méthode StreamingRecognize, chaque requête est limitée à l'envoi de 15 Ko de fragments audio. Tout dépassement de cette limite génère une erreur.

Concernant la taille de ce contenu, les limites suivantes s'appliquent à l'API (sous réserve de modification) :

Limite de contenu Durée du contenu audio
Requêtes synchrones ~1 minute
Requêtes en streaming ~5 minutes**

** Si vous avez besoin de diffuser du contenu pendant plus de 5 minutes, reportez-vous au tutoriel de diffusion en continu.

Pour les requêtes StreamingRecognize, le contenu audio doit être envoyé à un débit proche du temps réel.

Si vous tentez de traiter un contenu au-delà de ces limites, vous générerez une erreur. Pour en savoir plus, consultez les sections Messages d'erreur et Dépannage.

Dans une requête, vous pouvez également fournir des ressources PhraseSet et CustomClass. Les limites suivantes s'appliquent à un contexte de ce type :

Limite d'adaptation vocale Valeur
Valeur maximale autorisée pour l'amélioration des phrases 20
Phrases dans un PhraseSet 1200
Nombre maximal d'éléments dans un élément CustomClass 500
Nombre maximal de caractères par élément CustomClass 500
Nombre maximal d'ensembles d'éléments SpeechSet par SpeechAdaptation 20
Nombre maximal d'éléments CustomClasses par SpeechAdaptation 20

Limites des requêtes

Les limites d'utilisation actuelles de l'API Speech-to-Text sont les suivantes (sous réserve de modification) :

Type de limite Limite d'utilisation
Requêtes de ressources par période de 60 secondes (par région) \ 100
Requêtes d'opération par période de 60 secondes (par région) \ 150
Requêtes de reconnaissance synchrone par période de 60 secondes (par région) \ 300
Requêtes de reconnaissance en streaming par période de 60 secondes (par région) * 3000
Sessions de reconnaissance en streaming par période de 60 secondes (par région) * 60

* La méthode StreamingRecognize est limitée à 60 sessions simultanées par minute. StreamingRecognize a également une limite de 3 000 requêtes par minute qui s'applique à toutes les sessions simultanées. La requête StreamingRecognize initiale d'une session n'est pas comptabilisée dans le quota des requêtes.

Les requêtes et/ou les tentatives de traitement audio supérieures à ces limites généreront une erreur. Pour en savoir plus, consultez les sections Messages d'erreur et Dépannage.

Ces limites s'appliquent à chaque projet de développeur dans Speech-to-Text. Elles sont partagées entre toutes les applications et adresses IP associées à un projet de développeur donné.