En este documento se detallan las restricciones y los límites de uso actuales de la API de Cloud Speech‑to‑Text. Esta página se actualizará para reflejar los cambios que se realicen a estas restricciones y los límites de uso. Nos reservamos el derecho de modificar los límites.
Puedes solicitar un incremento de la cuota si es necesario. Consulta la página de cuotas de Cloud para obtener más información sobre cómo revisar y administrar tu cuota.
Después de enviar la solicitud, Google puede comunicarse contigo para pedirte más información y también informarte si se aprobó o rechazó.
Límites de contenido
El contenido que se envía a Speech‑to‑Text debe proporcionarse como datos de audio, ya sea directamente en el campo content
de la solicitud o referenciado en un URI de Google Cloud Storage, en el campo uri
de la solicitud. Existe un límite de 10 MB para todas las solicitudes síncronas enviadas a la API. En el caso del método StreamingRecognize
, cada solicitud está limitada a enviar 15 KB de fragmentos de audio. Si se supera este límite, se arroja un error.
La API contiene los siguientes límites de tamaño (sujetos a cambios) para este tipo de contenido:
Límite de contenido | Duración de audio |
---|---|
Solicitudes síncronas | Aproximadamente 1 minuto |
Solicitudes de transmisión | Aproximadamente 5 minutos** |
** Si necesitas transmitir contenido durante más de 5 minutos, consulta el instructivo de transmisión ilimitada.
Para las solicitudes StreamingRecognize
, el audio debe enviarse a una velocidad que se aproxime al tiempo real.
Si se intenta procesar contenido que exceda estos límites, se producirá un error. Si deseas obtener más información, consulta Mensajes de error y Solución de problemas.
En todas las solicitudes, también puedes proporcionar recursos PhraseSet y CustomClass. Se aplican los siguientes límites a ese contexto:
Límite de adaptación de voz | Valor |
---|---|
Valor máximo de mejora de frase permitido | 20 |
Frases en un PhraseSet | 1,200 |
Cantidad máxima de elementos en una CustomClass | 500 |
Cantidad máxima de caracteres por elemento de CustomClass | 500 |
Cantidad máxima de PhraseSets por SpeechAdaptation | 20 |
Cantidad máxima de CustomClasses por SpeechAdaptation | 20 |
Límites de solicitudes
Los límites de uso actuales de la API para Speech‑to‑Text son los siguientes (y están sujetos a cambios):
Tipo de límite | Límite de uso |
---|---|
Solicitudes de recursos cada 60 segundos (por región) \ | 100 |
Solicitudes de operaciones cada 60 segundos (por región) \ | 150 |
Solicitudes de reconocimiento síncronas cada 60 segundos (por región) \ | 300 |
Solicitudes de reconocimiento de transmisión cada 60 segundos (por región) * | 3000 |
Sesiones de reconocimiento de transmisión cada 60 segundos (por región) * | 60 |
* El método StreamingRecognize
tiene un límite de cuota de 60 sesiones simultáneas por minuto. StreamingRecognize
también tiene un límite de 3,000 solicitudes por minuto, que se aplica a todas las sesiones simultáneas.
La solicitud StreamingRecognize
inicial de una sesión no se cuenta para la cuota de solicitudes.
Si envías solicitudes o intentas procesar audio por encima de estos límites, se producirá un error. Si deseas obtener más información, consulta Mensajes de error y Solución de problemas.
Los límites se aplican a cada proyecto de desarrollador de Speech‑to‑Text y se comparten en todas las aplicaciones y direcciones IP que usen un proyecto de desarrollador específico.