Ce document présente les restrictions et limites d'utilisation actuellement appliquées à l'API Cloud Speech-to-Text. Il sera mis à jour en cas de modifications de ces restrictions et limites (nous nous réservons le droit de les modifier).
Vous pouvez demander une augmentation de quota si nécessaire. Consultez la page des quotas Cloud pour savoir comment afficher et gérer votre quota.
Une fois votre demande envoyée, Google peut vous contacter pour obtenir des détails supplémentaires, et vous informer de l'approbation ou du refus de votre demande.
Limites de contenu
Le contenu de Speech-to-Text est fourni sous forme de données audio,
soit directement dans le champ content
de la requête, soit référencé dans une adresse
URI Google Cloud Storage dans le champ uri
de la requête. Une limite de 10 Mo s'applique à toutes les requêtes
envoyées à l'API à l'aide de fichiers locaux. Dans le cas des
méthodes Recognize
et LongRunningRecognize
,
cette limite s'applique à la taille de la requête envoyée. Dans le cas de la
méthode StreamingRecognize
,
la limite des 10 Mo s'applique aussi bien à la requête StreamingRecognize
initiale qu'à la taille
de chaque message contenu dans le flux. Tout dépassement de cette limite génère
une erreur. Il n'y a aucune limite de taille pour les requêtes envoyées à l'aide de données
audio stockées dans un bucket Google Cloud Storage.
Concernant la taille de ce contenu, les limites suivantes s'appliquent à l'API (sous réserve de modification) :
Limite de contenu | Durée du contenu audio |
---|---|
Requêtes synchrones | ~1 minute |
Requêtes asynchrones | ~480 minutes* |
Requêtes en streaming | ~5 minutes** |
* Les contenus audio supérieurs à ~1 minute doivent utiliser le champ uri
pour référencer un fichier audio dans Google Cloud Storage.
** Si vous avez besoin de diffuser du contenu pendant plus de 5 minutes, reportez-vous aux tutoriels sur les flux continus.
Pour les requêtes StreamingRecognize
, le contenu audio doit être envoyé à un débit proche
du temps réel.
Si vous tentez de traiter un contenu au-delà de ces limites, vous générerez une erreur. Pour en savoir plus, consultez les sections Messages d'erreur et Dépannage.
Dans une requête, vous pouvez également fournir un SpeechContext contenant une liste d'expressions spécifiques à la requête. (Un seul mot compte pour une expression dans ce contexte.) Les limites suivantes s'appliquent à un contexte de ce type :
Limite d'adaptation vocale | Valeur |
---|---|
Expressions par requête | 5 000 |
Nombre total de caractères par requête | 100 000 |
Caractères par expression | 100 |
Limites des requêtes
Les limites d'utilisation actuelles de l'API Speech-to-Text sont les suivantes (sous réserve de modification) :
Type de limite | Limite d'utilisation |
---|---|
Requêtes de reconnaissance toutes les 60 secondes* | 900 |
Requêtes de ressources d'adaptation toutes les 60 secondes* | 10 |
Traitement par jour | 480 heures de contenu audio |
* Chaque session StreamingRecognize
est considérée comme une requête unique, même si
elle inclut plusieurs trames de contenu audio StreamingRecognizeRequest
au sein du
flux.
Les requêtes et/ou les tentatives de traitement audio supérieures à ces limites généreront une erreur. Pour en savoir plus, consultez les sections Messages d'erreur et Dépannage.
Ces limites s'appliquent à chaque projet de développeur dans Speech-to-Text. Elles sont partagées entre toutes les applications et adresses IP associées à un projet de développeur donné.