Cuotas y límites

En este documento se detallan las restricciones y los límites de uso actuales de la API de Cloud Speech‑to‑Text. Esta página se actualizará para reflejar los cambios que se realicen a estas restricciones y los límites de uso. Nos reservamos el derecho de modificar los límites.

Puedes solicitar un incremento de la cuota si es necesario. Consulta la página de cuotas de Cloud para obtener más información sobre cómo revisar y administrar tu cuota.

Después de enviar la solicitud, Google puede comunicarse contigo para pedirte más información y también informarte si se aprobó o rechazó.

Límites de contenido

El contenido que se envía a Speech‑to‑Text debe proporcionarse como datos de audio, ya sea directamente en el campo content de la solicitud o referenciado en un URI de Google Cloud Storage, en el campo uri de la solicitud. Existe un límite de 10 MB para todas las solicitudes síncronas enviadas a la API. En el caso del método StreamingRecognize, cada solicitud está limitada a enviar 15 KB de fragmentos de audio. Si se supera este límite, se arroja un error.

La API contiene los siguientes límites de tamaño (sujetos a cambios) para este tipo de contenido:

Límite de contenido	Duración de audio
Solicitudes síncronas	Aproximadamente 1 minuto
Solicitudes de transmisión	Aproximadamente 5 minutos**

** Si necesitas transmitir contenido durante más de 5 minutos, consulta el instructivo de transmisión ilimitada.

Para las solicitudes StreamingRecognize, el audio debe enviarse a una velocidad que se aproxime al tiempo real.

Si se intenta procesar contenido que exceda estos límites, se producirá un error. Si deseas obtener más información, consulta Mensajes de error y Solución de problemas.

En todas las solicitudes, también puedes proporcionar recursos PhraseSet y CustomClass. Se aplican los siguientes límites a ese contexto:

Límite de adaptación de voz	Valor
Valor máximo de mejora de frase permitido	20
Frases en un PhraseSet	1,200
Cantidad máxima de elementos en una CustomClass	500
Cantidad máxima de caracteres por elemento de CustomClass	500
Cantidad máxima de PhraseSets por SpeechAdaptation	20
Cantidad máxima de CustomClasses por SpeechAdaptation	20

Límites de solicitudes

Los límites de uso actuales de la API para Speech‑to‑Text son los siguientes (y están sujetos a cambios):

Tipo de límite	Límite de uso
Solicitudes de recursos cada 60 segundos (por región) \	100
Solicitudes de operaciones cada 60 segundos (por región) \	150
Solicitudes de reconocimiento síncronas cada 60 segundos (por región) \	300
Solicitudes de reconocimiento de transmisión cada 60 segundos (por región) *	3000
Sesiones de reconocimiento de transmisión cada 60 segundos (por región) *	60

* El método StreamingRecognize tiene un límite de cuota de 60 sesiones simultáneas por minuto. StreamingRecognize también tiene un límite de 3,000 solicitudes por minuto, que se aplica a todas las sesiones simultáneas. La solicitud StreamingRecognize inicial de una sesión no se cuenta para la cuota de solicitudes.

Si envías solicitudes o intentas procesar audio por encima de estos límites, se producirá un error. Si deseas obtener más información, consulta Mensajes de error y Solución de problemas.

Los límites se aplican a cada proyecto de desarrollador de Speech‑to‑Text y se comparten en todas las aplicaciones y direcciones IP que usen un proyecto de desarrollador específico.